数据科学家

Jan
11

展望2022 年,这些数据产品会引领潮流

数据类工作的重点是让数据变得有意义,为利益相关者提供可操作项目,而不仅仅是生成一份统计数据报告。数据科学家们的目标不是让观众了解如何利用数据,而是为他们提供一个框架,从而提高业务成单量。本文将带你展望2022,讨论几个数据行业的发展方向,包括大数据产品扩展、体验全面化、全球数据共享、多元化数据中心等等。

By Zhang Bonnie | Blog
DETAIL
Jan
11

Classification Algorithm 101: 一小时学会机器学习的分类算法

分类算法(Classification Algorithm)是一种机器学习算法, 主要为商业问题中的示例分配并且标签。一个易于理解的示例,是将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。本文会带领大家学习机器学习中的分类算法,以及解决数据科学家们面临的挑战——如何把一个商业问题转换为数据问题,甚至是数学问题。

By Zhang Bonnie | Blog
DETAIL
Jan
10

基于真实数据,公司是如何用数据科学预测用户差评的?

如何用数据科学预测用户差评?随着数据的累积和发展,越来越多公司利用数据科学方法为公司解决商业问题,最高程度提高用户留存率。本文以一家巴西的电商企业Olist公开的数据为例,为你介绍如何通过数据科学方法,预测用户的差评;通过不同的可视化内容,带你了解该数据的特点。

By Zhang Bonnie | Blog
DETAIL
Jan
04

如何在分类算法中使用逻辑回归

逻辑回归(Logistic Regression)是一种监督学习算法,尽管它包含“回归”这个词,但主要用于解决二元“分类”任务。“回归”与“分类”相矛盾,但逻辑回归的重点其实是在“逻辑”这个词,它指的是逻辑函数,在算法中实际上用于完成分类任务。本文将带你了解逻辑回归和相关的概率知识。

By Zhang Bonnie | Blog
DETAIL
Jan
04

ETL管道——管理数据科学工作流程的好方法

数据科学家(Data Scientists)通过日志、测试编写良好的模块化代码,确保代码按正常运行。但不幸的是,无论在设计上花费多少心思,都不可能得到完美的数据提取(Extraction)、转换(Transformation)和加载( Loading)管道。本文将介绍Prefect工具, 可帮助你熟练地且透明化地处理工作流管理,以及构建简单 ETL 管道的一些基本概念。

By Zhang Bonnie | Blog
DETAIL
Dec
23

Streamlit 数据科学必备工具

Streamlit 是一个基于 Python 的 Web 应用程序框架,致力于以更高效、更灵活的方式可视化数据,并分析结果。 Streamlit是一个开源库,可以帮助数据科学家和学者在短时间内开发机器学习 (ML) 可视化仪表板。只需几行代码,我们就可以构建并部署强大的数据应用程序。本文将带你了解Streamlit这个工具以及初始操作步骤。

By Zhang Bonnie | Blog
DETAIL
Dec
21

用数据科学技术,分析用户产品倾向

在所有商业营销策略中,公司的首要任务始终是为产品吸引正确的受众群体,从而提高销售额、降低营销费用。建模可以让数据科学家利用购买交易、调查和产品评论的大量消费者数据来找出描述、规定和预测消费者选择行为的模型,从而使企业能够制定更好的策略。本文将介绍如何运用数据科学方法,分析用户的产品选择倾向。

By Zhang Bonnie | Blog
DETAIL
Dec
19

DS数据科学家和DA数据分析师:要学习什么不同内容?

数据科学家(Data Scientist)和数据分析师(Data Analyst)的工作职责存在许多共同之处,但在日常工作中也存在很大的区别。岗位对教育程度和工作经验的要求一直在改变,对这两个岗位也是如此。本文中,我们将用一些例子说明数据科学家或数据分析师的学习区别,以及他们的共通点和区别所在。

By Zhang Bonnie | Blog
DETAIL