Blog

Nov
15

Airflow 101: 隐藏小技巧帮你快速上手!

Airflow 是一个开源的workflow automation框架,能让开发人员高效的创作、调度和监控数据管道(Data Pipeline)。 成功的data pipeline可以有效地移动数据,最大限度地减少任务之间的暂停和阻塞,使每个流程都能正常运行。Airflow相关经验是数据工程和数据科学家最需要的技术技能之一,在许多数据职位招聘信息中都被列为要求的技能。

By Zhang Bonnie | Blog
DETAIL
Nov
15

怎么用Pandas聚合时间序列数据?

时间序列是一种特殊的数据,其数据点在时间上存在相关性。在分析时间序列数据时,你得到结论的效率很大程度上取决于处理时间维度的能力。在本文中,我想介绍几种方法,用于分析当前最流行的Python数据处理库—Pandas 是如何帮助你执行这些聚合的,以及在处理时间时,有什么特别之处。

By Zhang Bonnie | Blog
DETAIL
Nov
13

没有任何经验?如何拿到第一个数据科学offer

在数据科学领域获得第一份工作并不容易。很多 IT 公司都有实习生岗位,工作期间提供培训,但数据科学却不在其中。数据科学团队通常都很精明能干,可以处理多个业务问题。本文将从熟悉编程语言、学习探索性数据分析、了解不同的机器学习算法、有进行清晰沟通的能力等方面,带你了解如何成功求职数据科学!

By Zhang Bonnie | Blog
DETAIL
Nov
13

数据工程必备技能:什么是Apache Airflow?

工作自动化在所有行业中都起着关键作用,它是实现功能效率的最快方法之一。如果我们的日常任务能按照规定的时间自动触发,并且所有流程都按顺序执行,那就太好了。Apache Airflow 是一个以编程方式编写、安排和监控工作流的平台。它就是这样一种非常有帮助的工具。无论是数据科学家、数据工程师还是软件工程师,这个工具很会很有用。

By Zhang Bonnie | Blog
DETAIL
Nov
10

2021倒数51天!数据应用学院陪你6个月转行数据科学

过去几年,大数据的技术飞速发展,数据科学家的角色成为最受欢迎的职位之一。 数据科学家负责编写和分析大型结构化、非结构化数据集,这个角色结合了数学、统计学,机器学习和计算机科学技能,来理解和分析大数据,然后使用这些信息来创建业务解决方案。想要进入这个领域的人需要具备哪些技能呢?

By Zhang Bonnie | Blog
DETAIL
Nov
08

在微软成功的数据科学家身上,我学到这5个习惯

数据科学家的工作不是一份单一工作,要做的不仅仅是分析;专业人士必须具备数据工程、人工智能、可视化、数据挖掘等方面的大量知识。本文将介绍,通过峰会接触到的数据科学领域的领头人们,身上的一些优秀的工作素质和习惯,帮助你不断学习和提高自己数据科学的核心知识。

By Zhang Bonnie | Blog
DETAIL
Nov
06

如何用Python处理金融数据?

Python 是一种通用编程语言,在分析数据方面变得越来越受欢迎。通过Python,你的工作效率会越来越高,能更加有效地集成系统;世界各地的公司都在用 Python 从数据中收集知识。本文用亚马逊的股票数据(Amazon Stock Data)进行简单的操作实践,引导你们完成一些很有意义的操作实践,帮助了解如何使用 Python 处理金融数据,用为初学者提供完整版指南。

By Zhang Bonnie | Blog
DETAIL
Nov
06

5个提升你分析Slide Decks的技巧

商业分析师和数据科学家经常会使用幻灯片展示发现的结果。幻灯片不仅是可以告知、启发和说服听众的工具,而且还可以作为一种文档记录,在几周或几个月后仍可返回查看。本文将分享一些分析工作中对你有所帮助的一些技巧,这些技巧可以极大地帮助你设计出更易于阅读、且更吸引观众的演示文稿。

By Zhang Bonnie | Blog
DETAIL