数据科学

Jun
07

强大的 Python Matplotlib 函数——创建漂亮的数据可视化

Matplotlib 是一个很优秀的 Python 包,被我们用于数据的可视化,Matplotlib 几乎可以制作任何类型的数据可视化图表。本文中,我将向您展示如何使用最重要的几个matplotlib 函数,你可以按照自己的需求进行任何类型的数据可视化。本文将用一个线型图(line plot)为例,逐步介绍一些可以用在图表中的重要的matplotlib 函数。

By Zhang Bonnie | Blog
DETAIL
May
28

2022年,FAANG公司数据岗位薪资一览

薪资透明度是一个实时的话题。在本文中,我想尝试使用数据进行薪资的分析。我之前在谷歌工作过,认识很多FAANG公司的人(Facebook, Apple, Amazon, Netflix,Google)。我将这些公司作为我项目的起点,查看了来自levels.fyi 和otta.com 等来源的4000多个数据点,为大家分析2022年FAANG公司数据岗位薪资水平。

By Zhang Bonnie | Blog
DETAIL
May
25

构建数据科学管道的 4 个步骤

数据科学有很多内容要消化,但是当你退后一步再看时,你会发现,它们大多归都可以总结为相同的四个步骤,其中包括查询数据或获取数据、预处理数据、训练数据、然后部署模型。本文的目的,是介绍一个适用于每个数据科学项目的构建步骤。这不仅对初学者数据科学家有帮助,而且对产品经理、软件工程师,甚至可以为高级数据科学家都能带来新视角的帮助。

By Zhang Bonnie | Blog
DETAIL
May
25

2022年,我们给数据科学初学者推荐这5本书

准备好学习更多货真价实的数据科学知识了吗?本文中,我将分享数据的初学者在第一次学习数据科学时可以选择的最佳书籍。这些书帮助成千上万的人学习了数据分析、可视化、高级编程技能、机器学习等等,甚至还帮助他们找到了工作!

By Zhang Bonnie | Blog
DETAIL
May
23

Python为什么这么火?如何利用Python进行数据分析?

编程语言是一个计算机的概念,在我们有了计算机以后,想让它帮助我们做事情,就要通过计算机语言和它进行对话、交互,计算机语言能够被计算机所执行,完成我们需要做的相关任务。今天我们主要的目标是:给大家介绍在所有的编程语言里,为什么Python能被广泛使用,甚至排名第一,给那些做数据分析相关工作和转行的小伙伴介绍数据分析行业里如何使用Python。

By Zhang Bonnie | Blog
DETAIL
May
16

仪表板设计的Dos and Don’ts

Tableau、Cognos Analytics和Python都是创建仪表板常用的工具。有了这些各种各样的工具,怎样才能打造一个出色的仪表板呢?当一个仪表板非常好用的时候,我们会直接去发现和寻找图中带来的见解!随着时间的推移,我找到了一些有效的技术来制作优秀的仪表板。本文将介绍一些仪表板设计的注意事项,可以帮助你更好地完成下一个数据可视化项目!

By Zhang Bonnie | Blog
DETAIL
May
16

数据科学是如何变革Advertisement 广告行业的?

随着移动互联网的发展得到长足的发展,广告行业也发生了很大的变革。以前的广告形式可能是广告产品册类似的形式,但现在的广告大部分是以数据的形式来呈现,也就是所谓的数字广告。本文带大家了解数据科学是如何变革广告行业的。包括广告行业的数据收集、常用分析方法、数据分析是如何提升广告效能的、以及广告行业的数据分析工作机会。

By Zhang Bonnie | Blog
DETAIL
May
05

数据清理必备的Python Packages

数据科学工作主要在开发机器学习模型和评估技术指标这两个部分。除此之外,数据科学家们还需要对数据进行收集、清洗、分析、理解等工作。有一些方法可以帮我们通过使用数据清洗包来缩短数据清洗处理时间,本文就将带你了解这些数据清理包,以及他们的使用方法。

By Zhang Bonnie | Blog
DETAIL