Blog

Mar
29

手把手教你用Python创建SQL数据库!

会写SQL很重要,能高效地查询数据库被认为是数据分析师/科学家最基本的技能之一。但如何在没有数据库的情况下练习数据库查询呢?在今天的文章中,让我们一起来解决这个基本问题,学习如何从零开始创建自己的MySQL数据库。在Python和一些外部库的帮助下,我们创建一个脚本来自动创建并使用随机生成的数据,填充我们的表格。

By Zhang Bonnie | Blog
DETAIL
Mar
28

如何准备数据科学的现场编程面试?

现在,大多数数据科学职位都要求候选人掌握一到两种编程语言,而现场编程是面试过程的一个重要组成部分。DS 面试的编程问题一般包括了 SQL、Python 或 R 的应用;随着数据科学的发展,也逐渐扩展了关于AI、机器学习等问题。本文将分享一系列技巧,帮助你为下一次面试做准备。

By Zhang Bonnie | Blog
DETAIL
Mar
28

数据科学初学者起航——六本免费书籍

数据科学是一个跨学科领域,需要计算机科学、数学、统计学和机器学习等多个领域的技能。作为学习数据科学的初学者,你可能不太了解怎么开始学习。如果你没有时间和金钱成本选择训练营或者课程,那你也可以从免费或低成本的资源学习开始。 本文将为初学者介绍六本免费书籍,每本书都涵盖了数据科学中最重要的基本概念之一。

By Zhang Bonnie | Blog
DETAIL
Mar
24

数据工程师都做哪些工作?带你了解我的一天

随着时间的推移,数据变得愈发重要,有些人甚至把它称为“新型汽油”。数据工程师的工作是让原始数据剥离源头,变成干净的数据,妥善保存、并进行分析。更准确地说,数据工程师构建的系统(有时称为管道)可以移动、转换、清理并聚合数据,帮助企业更快获取信息。本文将带你了解数据工程师的一天。

By Zhang Bonnie | Blog
DETAIL
Mar
24

冬奥会你看了么?体育界的数据分析应用

数据分析对各行各业的影响正在逐渐深入,新的技术可能会对体育行业产生帮助。比如在一个球队中,教练要怎样找到最有潜力的运动员,需要怎样补充人员来维持球队实力的平衡?通过分析球队最近的表现和趋势,来做出更好的决策,这些都可以根据数据来做一个评判。本文中,我们一起来讨论一下数据分析在体育界的应用。

By Zhang Bonnie | Blog
DETAIL
Mar
20

如果你的数据科学生涯只能用3个libraries,学这三个

数据科学库(Data Science Library)无处不在。从数据清理到可视化、机器学习模型的创建到超参数的调优,数据科学库都在发挥着重要作用。每个库的目标都是简化并加快任务,它们涵盖大量常见和基本任务,提供易于使用且直观的语法。本文将带你了解最值得学习的三个数据科学库,满足你在数据操作和分析、数据可视化和机器学习方面的大部分需求。

By Zhang Bonnie | Blog
DETAIL
Mar
18

一篇清单,带你了解决策树Decision Tree术语

如果你刚刚接触学习机器学习领域,你可能会感到非常困惑,尤其是袋装法(Bagging)、提升法(Boosting)、集成方法(ensemble methods)和随机森林(Random forest)这些决策树相关的术语和概念,也难免会抗拒学习这些深奥的知识。 本文创建了一个备忘单(Cheat-Sheet),可以作为快速参考,围绕了决策树学习方法主题做了总体概述。

By Zhang Bonnie | Blog
DETAIL
Mar
18

微软数据科学家面试,都问什么SQL问题?

数据库管理系统 (RDBMS) 是企业们最常用的数据库形式,这也使 SQL 成为必备技能。Microsoft 的数据分析师职位主要设计并构建数据模型,为公司团队提供有意义的数据和模型。本文将展示Microsoft 的面试中可能遇到的真实场景。我们将向你展示如何分解遇到的问题,逐步了解解决问题的逻辑,并讨论如何优化解决方案,提高性能。

By Zhang Bonnie | Blog
DETAIL