Blog

Jan
15

如何开发群组分析(Cohort Analysis)的数据APP

群组分析(Cohort Analysis)是一个非常有效的工具,可以帮助公司更好地了解用户需求及习惯。数据科学家可以通过将具有相似属性(例如,注册日期、首次购买日期、潜在用户来源等)的用户或用户进行分组,然后观察关键绩效指标(KPI:例如,参与度、收入、留存率),收集有用的见解。本文将通过一个实际案例,带你了解群组分析的应用过程。

By Zhang Bonnie | Blog
DETAIL
Jan
13

DataJob入门 — 在 AWS 上构建和部署无服务器数据管道

数据工程师(Data Engineer)的核心工作包括了构建、部署、运行和监控数据管道。但在数据和 ML 工程领域工作时,缺少一种工具,用于简化在 AWS 服务(如 Glue 和 Sagemaker)上部署数据管道过程,以及轻松通过 Step Functions 编排数据管道步骤。所以, DataJob诞生了!在本文中,我将向你演示如何安装 DataJob,通过简单示例给予指导,展示 DataJob 的某些功能。

By Zhang Bonnie | Blog
DETAIL
Jan
12

如何征服数据科学面试中的Python编程考试

数据科学是一门技术学科。 数据科学工作的大部分涉及收集、清理数据并将其处理为可用格式。很多数据科学项目都是高度协作的,涉及多个利益相关者。 因此,要完成工作,必须具备基本的编程能力。编程已成为数据科学面试中不可或缺的一部分。通过本文,我想通过分享最近遇到的各种代码面试和问题,帮你战胜自己内心的恐惧。

By Zhang Bonnie | Blog
DETAIL
Jan
11

展望2022 年,这些数据产品会引领潮流

数据类工作的重点是让数据变得有意义,为利益相关者提供可操作项目,而不仅仅是生成一份统计数据报告。数据科学家们的目标不是让观众了解如何利用数据,而是为他们提供一个框架,从而提高业务成单量。本文将带你展望2022,讨论几个数据行业的发展方向,包括大数据产品扩展、体验全面化、全球数据共享、多元化数据中心等等。

By Zhang Bonnie | Blog
DETAIL
Jan
11

Classification Algorithm 101: 一小时学会机器学习的分类算法

分类算法(Classification Algorithm)是一种机器学习算法, 主要为商业问题中的示例分配并且标签。一个易于理解的示例,是将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。本文会带领大家学习机器学习中的分类算法,以及解决数据科学家们面临的挑战——如何把一个商业问题转换为数据问题,甚至是数学问题。

By Zhang Bonnie | Blog
DETAIL
Jan
10

数据的视角——如何用理性思维看待数据

数据的概念在现代社会已存在许久,至少从软件的角度来看是这样。每个人都多多少少了解数据方面的基础知识,知道如何保存数据,知道如何使用数据。本文将展示一些与数据有关的观点,以及一些有助于在数据科学领域取得成功的思维方式。通过了解这些想法和思维方式,也许你会发现,在不同场景中处理数据时能更加得心应手。

By Zhang Bonnie | Blog
DETAIL
Jan
10

基于真实数据,公司是如何用数据科学预测用户差评的?

如何用数据科学预测用户差评?随着数据的累积和发展,越来越多公司利用数据科学方法为公司解决商业问题,最高程度提高用户留存率。本文以一家巴西的电商企业Olist公开的数据为例,为你介绍如何通过数据科学方法,预测用户的差评;通过不同的可视化内容,带你了解该数据的特点。

By Zhang Bonnie | Blog
DETAIL
Jan
10

电商是如何应用数据科学的?

随着人工智能(AI)的引入,电商平台正在有效利用数据,使必需品的供求达到平衡。出于各种原因,我们都非常熟悉电商平台,并且每天都在使用这些平台。尽管跨国公司使用机器学习算法的方式多种多样,本文中,我们将关注在所有电商平台运营中至关重要的算法,包括时间序列,推荐系统,协同过滤和自然语言处理等等。

By Zhang Bonnie | Blog
DETAIL