Blog

Jan
04

ETL管道——管理数据科学工作流程的好方法

数据科学家(Data Scientists)通过日志、测试编写良好的模块化代码,确保代码按正常运行。但不幸的是,无论在设计上花费多少心思,都不可能得到完美的数据提取(Extraction)、转换(Transformation)和加载( Loading)管道。本文将介绍Prefect工具, 可帮助你熟练地且透明化地处理工作流管理,以及构建简单 ETL 管道的一些基本概念。

By Zhang Bonnie | Blog
DETAIL
Jan
03

5种机器学习的分类器算法

分类是一项依赖于机器学习算法(Machine Learning Algorithm)的自然语言处理任务。分类是识别、理解,并将想法、对象分到预设类别或“子群”的过程。机器学习程序使用预先分类的训练数据集,通过各种算法对未来的数据集进行分类。使用分类算法,文本分析软件可以执行情绪分析的任务,根据主题和意见的极性对非结构化文本进行分类。

By Zhang Bonnie | Blog
DETAIL
Dec
23

Streamlit 数据科学必备工具

Streamlit 是一个基于 Python 的 Web 应用程序框架,致力于以更高效、更灵活的方式可视化数据,并分析结果。 Streamlit是一个开源库,可以帮助数据科学家和学者在短时间内开发机器学习 (ML) 可视化仪表板。只需几行代码,我们就可以构建并部署强大的数据应用程序。本文将带你了解Streamlit这个工具以及初始操作步骤。

By Zhang Bonnie | Blog
DETAIL
Dec
21

用数据科学技术,分析用户产品倾向

在所有商业营销策略中,公司的首要任务始终是为产品吸引正确的受众群体,从而提高销售额、降低营销费用。建模可以让数据科学家利用购买交易、调查和产品评论的大量消费者数据来找出描述、规定和预测消费者选择行为的模型,从而使企业能够制定更好的策略。本文将介绍如何运用数据科学方法,分析用户的产品选择倾向。

By Zhang Bonnie | Blog
DETAIL
Dec
21

假期将至!旅游业常见的7个数据科学应用

数据科学为许多行业带来了新的机遇—— 旅游业也是其中之一。作为一个不断发展的行业,持续增加的消费者需要大量的数据处理。 这也是数据科学算法在旅游业如此重要的原因。 旅游相关的行业,如航空公司、酒店行业、预订和预订网站等,每天都面临着不断扩大的旅游客户群的挑战。本文将带大家了解为大家讲解数据分析在旅游行业中的应用。

By Zhang Bonnie | Blog
DETAIL
Dec
19

DS数据科学家和DA数据分析师:要学习什么不同内容?

数据科学家(Data Scientist)和数据分析师(Data Analyst)的工作职责存在许多共同之处,但在日常工作中也存在很大的区别。岗位对教育程度和工作经验的要求一直在改变,对这两个岗位也是如此。本文中,我们将用一些例子说明数据科学家或数据分析师的学习区别,以及他们的共通点和区别所在。

By Zhang Bonnie | Blog
DETAIL
Dec
19

数据可视化Data Visualization需要哪些图表技能?

数据可视化(Data Visualization)通过图形,为大家提供视觉感受,让我们清楚地了解信息的含义。 这使得人类思维更自然地理解数据,从而更容易识别大型数据集中的趋势、模式和异常值。在此基础之上,选择正确的图表类型也非常重要。本文将带你了解最常用的几个图表类型,和对应的应用场景。

By Zhang Bonnie | Blog
DETAIL
Dec
16

新兴数据职位:应用数据科学家的工作职能

数据科学一直在不断发展。过去十年,在运营以客户为中心的服务和业务领域中,数据科学已经逐渐从“加分项”转变为“必备技能”。新的职位出现了——应用数据科学家(Applied Data Scientist)。应用数据科学家是研究数据科学的人,通过将理论概念框架和算法应用于基础数据,为业务问题提供可行的解决方案。本文将带你了解这个新兴职业和工作只能。

By Zhang Bonnie | Blog
DETAIL