Blog

Jan
21

数据科学家面试,我被问到这六个问题

近年来,数据科学实现跨越式发展。因此,数据科学家的需求大幅增加,许多人转行从事该领域的工作。数据科学是一个跨学科领域,因此所需的技能并不集中在某个主题上。要想成为一名合格的数据科学家候选人,你需要掌握一系列的技能。在本文中,我将分享在数据科学家面试中经常出现的 6 个问题。

By Zhang Bonnie | Blog
DETAIL
Jan
18

算法基础——10个常见编程面试题

申请数据科学岗位,准备编程面试需要大量的时间。候选人需要学习不同的编码原理、数据结构和算法。面试中一定会出现各种算法,所以在进行编程面试之前反复练习非常重要。本文将重点讨论基本编程面试中常见的有关递归的基本问题。本文整理了一些常见的面试问题,你将了解不同的递归算法(Recursion Algorithm)问题,供你练习!

By Zhang Bonnie | Blog
DETAIL
Jan
18

电商平台之战:Square VS Shopify的数据解决方案

当今世界,数据的重要性达到了新的高度。在电子商务和零售行业中,我们可以通过跟踪客户的行为来预测购买、利润、损失,甚至引导客户购买商品。 这些电商平台通过分析数据,创建他们客户的档案,了解他/她的痛点,并相应地营销他们的产品以推动客户购买。本文带你全面了解以Square和Shopify为主的电商平台对数据分析的应用。

By Zhang Bonnie | Blog
DETAIL
Jan
15

如何开发群组分析(Cohort Analysis)的数据APP

群组分析(Cohort Analysis)是一个非常有效的工具,可以帮助公司更好地了解用户需求及习惯。数据科学家可以通过将具有相似属性(例如,注册日期、首次购买日期、潜在用户来源等)的用户或用户进行分组,然后观察关键绩效指标(KPI:例如,参与度、收入、留存率),收集有用的见解。本文将通过一个实际案例,带你了解群组分析的应用过程。

By Zhang Bonnie | Blog
DETAIL
Jan
13

DataJob入门 — 在 AWS 上构建和部署无服务器数据管道

数据工程师(Data Engineer)的核心工作包括了构建、部署、运行和监控数据管道。但在数据和 ML 工程领域工作时,缺少一种工具,用于简化在 AWS 服务(如 Glue 和 Sagemaker)上部署数据管道过程,以及轻松通过 Step Functions 编排数据管道步骤。所以, DataJob诞生了!在本文中,我将向你演示如何安装 DataJob,通过简单示例给予指导,展示 DataJob 的某些功能。

By Zhang Bonnie | Blog
DETAIL
Jan
12

如何征服数据科学面试中的Python编程考试

数据科学是一门技术学科。 数据科学工作的大部分涉及收集、清理数据并将其处理为可用格式。很多数据科学项目都是高度协作的,涉及多个利益相关者。 因此,要完成工作,必须具备基本的编程能力。编程已成为数据科学面试中不可或缺的一部分。通过本文,我想通过分享最近遇到的各种代码面试和问题,帮你战胜自己内心的恐惧。

By Zhang Bonnie | Blog
DETAIL
Jan
11

展望2022 年,这些数据产品会引领潮流

数据类工作的重点是让数据变得有意义,为利益相关者提供可操作项目,而不仅仅是生成一份统计数据报告。数据科学家们的目标不是让观众了解如何利用数据,而是为他们提供一个框架,从而提高业务成单量。本文将带你展望2022,讨论几个数据行业的发展方向,包括大数据产品扩展、体验全面化、全球数据共享、多元化数据中心等等。

By Zhang Bonnie | Blog
DETAIL
Jan
11

Classification Algorithm 101: 一小时学会机器学习的分类算法

分类算法(Classification Algorithm)是一种机器学习算法, 主要为商业问题中的示例分配并且标签。一个易于理解的示例,是将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。本文会带领大家学习机器学习中的分类算法,以及解决数据科学家们面临的挑战——如何把一个商业问题转换为数据问题,甚至是数学问题。

By Zhang Bonnie | Blog
DETAIL