“小瑞,还是大姨,你弟弟小福也想当那个什么数据构架师。你那个工地还缺人吗?“

“小瑞,还是大姨,你弟弟小福也想当那个什么数据构架师。你那个工地还缺人吗?“

上一期文章我们细分了数据行业的职位类别,这一期我们将详细讲解每个职位所需要的具体技能。学好相应技能,能有效美化你的简历,让你成为公司眼中的“香饽饽”。

Part 1 不同职位所需要的语言技能

1、Dominant Language

在分析了1000多份 Indeed 上的 Job Posting 之后,我们得到了目前数据分析应用最广泛的编程语言排列。R 与 Python 曾经试图在数据科学界争霸,但如今市场需求告诉我们,Python无疑是数据科学语言界的 leader。Python在各个职位都排列非常靠前,R 甚至有时候比快要过时的 SAS 还靠后。SQL 作为数据库语言,在 job posting 中位列第二。

Data Scientist 所需要的语言技能排名为:Python,SQL,Scala,Lua,Java,SAS,R,C++, Matlab。

2、 Machine Learning Engineer

Machine Learning Engineer 对于编程语言的需求更加多样,因为他们需要从零开始编写算法,并且将机器学习的模型运用到大数据环境中。因此,相关的语言,比如C ++ 和 Scala 的学习都非常重要。

这一岗位语言的排名顺序为:Python,Scala,Java,C++,Lua,SQL,Javascript,Matlab,CSS,C#。

3 、 Data Engineer

Data Engineer 总是在处理数据库,因此SQL是必会语言。Python固然重要,但是位列Scala 和 Java 这些处理大数据的语言之后。

这一岗位的编程语言排名为:SQL,Scala,Java,Python,Lua.

4、Data Scientist

值得一提的是,Scala已经跻身进入了数据科学领域top3语言,前三分别是Python, SQL 和 Scala。想成为一名数据科学家的你,如果在考虑学一门新的语言,那就选择Scala  吧。

Part 2 不同专业领域需要的技能

如果按照专业领域来分,又有不同排列顺序的语言可以学习。

1、Big Data

对于大数据的处理上,Spark和Hadoop无论在哪个职位的需求都是排在前两位的,其次是Kafka和Hive。

2、Deep Learning

深度学习主要出现在Machine Learning Engineer 的招聘广告中。在深度学习领域里,TensorFlow无疑 Deep Learning 界的爸爸。但是Keras由于太过阳春白雪,基本不被机器学期的从业者所使用。

如果要从事深度学习方面的工作,语言需求排名为:TensorFlow,Torch,Caffee,MXNet。

3、Deep Learning

对于云处理的技能需求,当然还是目前最热门的AWS。

4、Computer Vision

市场上,计算机视觉技能需求非常大。如果你想要成为一个名数据科学家(Data Scientist),你可以选择多种项目来展示你的能力,但如果职业目标是机器学习工程师,计算机视觉是必须要展示的技能。

5、Data Visualization

数据科学家一般都被要求精通几样视觉工具,而数据工程师和机器学习工程师则很少被要求掌握数据可视化的技能。Tableau易学好用的特点让它稳居视觉工具第一位。对于Data Scientist来说,因为有着一定的编程基础,可视化工具也有更多的选择,比如Shiny,Matplotlib,ggplot,Seaborn,都非常重要。

最后,无论处在什么职位,git都非常重要,而工程师们又需要掌握Docker。

Part 3 创建完美的履历

接下来,我们来根据这些技能,创建完美的履历。

1、Data Scientist 比起商业或分析能力,更应该展示机器学习的能力。虽然DS 是一个需要方方面面都懂的职业,但是机器学习无疑是其中的主旋律。一些其他的要求还包括:商业,管理,沟通,研发,分析,产品,技术,统计,算法,模型,客户和计算机科学。

2、Machine Learning Engineer 需要展现自己研发,系统设计和建造方面的能力。解决方案,产品,软件和系统是这一职业的核心。围绕这一主题展开,包含研究,算法,人工智能,深度学习和计算机视觉的项目经验,都是可以在简历上重点强调的。同时为了更好地处理data pipeline,对于Machine Learning也有一定的需求。

3、Data Engineer 专业性更强。 数据工程师主要要展示他们通过设计和创建 pipelines 来支撑产品,系统和解决方案的能力。机器学习也很重要,因为 pipelines 主要被用来支持机器学习模型运用。

以上就是数据科学各个职业的具体技能要求,是否对你技能储备有所帮助呢?如果要学习的技能太多不止从何下手,快来报名参加我们的Data Scientist课程,业界大牛手把手带你学知识,做project,一步步掌握数据科学必备技能。

贯穿文章中隐隐的红色,有没有让大家想起什么呢?

原文作者:George Liu 

翻译作者:创作小废物

美工编辑:喝豆奶的Narcia 

校对审稿:卡里

原文链接:https://towardsdatascience.com/what-does-an-ideal-data-scientists-profile-look-like-7d7bd78ff7ab