Blog

Aug
07

数据科学家和数据工程师求职的5大区别

数据科学相关岗位种类繁多,所负责的职务有时又有所穿插。简单来说,数据工程师构建和维护让数据科学家访问和解释数据的系统。而数据科学家使用经过清理的数据构建和训练预测模型。但他们直接的区别远远不止如此。本文从多方面的角度分析比较了DE和DS两个职位的差异,带你更清楚地理解他们有什么不同。

By Zhang Bonnie | Blog
DETAIL
Aug
03

2021 Data Engineer求职必备技能

数据工程师(Data Engineer)在各种环境中工作,以构建收集、管理原始数据、并将其转换为可供数据科学家和业务分析师解释的可用信息的系统。 他们的最终目标,是使数据可访问,以便组织可以使用它来评估和优化其绩效。由于数据相关的职位众多,让很多想进入数据领域的人摸不清方向,本文将详细介绍数据工程师必备的职业技能。

By Zhang Bonnie | Blog
DETAIL
Aug
03

Apache Spark——一个灵活的数据处理框架

多年来,Hadoop 一直是大数据领域无可争议的领头羊——直到 Spark的 出现。自 2014 年首次发布以来,Apache Spark 一直在点燃大数据世界。 凭借 Spark 便捷的 API 和承诺的比 Hadoop MapReduce 快 100 倍的速度,一些分析师认为 Spark 标志着大数据新时代的到来。本文将为你介绍这两个大数据处理框架,并展开讨论Apache Spark的具体优势。

By Zhang Bonnie | Blog
DETAIL
Aug
01

Spark/Hadoop/MapReduce入门101

Apache Spark是用于大规模数据处理的统一分析引擎,是现如今非常流行的通用集群计算系统。它提供了 Java、Scala、Python 和 R 中的高级 API,以及支持通用执行图像的优化引擎,有便于使用、可以在多个平台上运行的特点,结合了 SQL、数据流和复杂分析。本文介绍了Apache Spark的必备知识,同时介绍了与之相关的MapReduce和Hadoop,带你快速入门Spark基础知识!

By Zhang Bonnie | Blog
DETAIL
Jul
31

Python时间模块四大必备知识点

Python是数据分析常见工具。处理日期和时间是分析过程中最重要的挑战之一。而Python内置的 各个模块可以通过多种方式处理日期和时间,帮助人们管理日期和时间的复杂性质。在本文中,我们会带大家了解Python和时间相关的模块中的4个对象,即date、time、datetime和timedelta,通过具体示例,让你更容易理解他们的用法和场景。

By Zhang Bonnie | Blog
DETAIL
Jul
23

6个业界认可含金量最高的数据科学证书——你拿下几个了?

数据分析是现如今全球增长最快的行业之一。如果你想以数据分析师开始你的职业生涯,那么拿到证书是提高被录用机会的最佳方法之一。 数据科学的证书能衡量你的技能和知识,并帮你向雇主展示你的实力。 本文介绍了6个广受业界好评的高含金量数据科学证书,给你的简历或作品增加一些价值。

By Zhang Bonnie | Blog
DETAIL
Jul
23

DS/BA/MLE岗位2021北美薪资最全对比

随着数据科学领域的逐渐流行,人们逐渐注意到有多种职位的产生,以及不同职能的重叠。数据科学家、商业分析师、机器学习工程师等等职位层出不穷。而它们的薪水可能因多种因素而经常变化。本文将概述几个最受欢迎的技术角色的薪水的主要差异,包括不同岗位在不同地区上薪资的差异,助力你未来的职业规划!

By Zhang Bonnie | Blog
DETAIL
Jul
21

使用Amazon SageMaker和AWS Lambda进行无服务器管道自动化模型训练和部署

大多数数据科学爱好者都知道如何构建和训练模型,但如何部署模型并让他在现实生活中有用,有时是个有挑战性的问题。 幸运的是,有许多不同的平台和工具可用于帮助进行模型部署。 Amazon Sagemaker 是最具代表的工具之一,因为它在很大程度上减少了构建、训练和部署模型的努力和犹豫。 借助 Lambda 函数,可以在 AWS 云上自动训练和部署模型。

By Zhang Bonnie | Blog
DETAIL