专业型or复合型数据科学家,你是哪一款?

专业型or复合型数据科学家,你是哪一款?

数据科学家可以分为两种类型:专业型(Vertical)和复合型(Horizontal)。

专业型数据科学家

他们通常在一些比较窄的领域有着深度研究。他们可能是非常熟悉所有的排序算法的计算复杂性的计算机科学家他们也可能是知道一切关于特征值、奇异值分解和它的数值稳定性以及伪极大似然估计估计量的渐近收敛的统计学家他们也是那些具有多年写Python代码包括图形库经验来做API开发和网络爬虫技术的软件工程师或者是有着很强大的数据建模数据仓库图表数据库Hadoop和NoSQL等专业知识和技术的数据库专家。他们还有可能是一个精通贝叶斯网络SAS和SVM的预测建模方面的专家。

复合型数据科学家

他们属于商业分析师统计学家计算机科学家和一些领域里的专家的混合物。这种数据科学家会将视野与他们的技术知识相结合。他们可能不是在特征向量,广义线性模型或者其他一些有点老套陈旧的领域的专家但他们更加了解那些前沿的和数据驱使的方法和技术。这些方法技术多应用于非结构化的数据、流数据、以及大数据分析中。比如说这些方法中包含了用很简单的也很实用的Analyticbridge 定理去建立置信区间。这种类型的科学家能设计高效简单可复制和可扩展的代码和算法。


Vincent Granville: 在我的观点看来第一种数据科学家并不能算得上是真正意义上的数据科学家。他们是严格古板的大学教育系统的产物。这种刻板的大学系统让他们成为了要么是计算机科学家要么是统计学家要么是运筹学或者是工商管硕士。但他们没有一个人是以上四个职业结合的产物。这就是为什么我们创造了数据科学这样的一个项目的原因之一。同时这也是公司的招聘人员找不到数据科学家的原因之一他们发现招聘进公司的大多数都是第一种数据科学家。这些公司的招聘人员还没有足够的经验去识别出第二种数据科学家。在这么多的数据分析专业人士中只有第二种数据科学家才是真正意义上的能创造财富、会创造投资回报的人才。

有两个原因:

一、

那些没有经过训练的公司招聘人员会很快的发现第二种数据科学家缺少一些很传统的知识。这种传统知识是真正的计算机科学家或者统计学家或者工商管理硕士一定会具有的。这样招聘人员们就会从众多的申请者里面将这些第二种数据科学家给淘汰出局。所以公司的老板们需要一个不仅很熟悉软件工程商业分析统计学和计算机科学这些专业知识的招聘人员并且这个招聘人员还需要能够识别那些不能被简历上的那些常见的关键词就能归纳的品质能力。这个招聘人员同时要认清楚什么技能很重要什么技能可以被忽略从而找到公司所需要真正的数据科学家。

二、

第二种数据科学家在面对一些工作机会同时又有创造投资收益的真本事但却在最终都独立工作创造自己的公司。并且有时候直接和那些需要他们这些真正数据科学家的公司们竞争。在不止一次地在Microsoft, eBay, amoxil-info.net 或Google的面试中失败后他们再也不会去申请这些公司了。这又进一步减少了这些大公司所需要的合格的人才。

写在最后

希望我们的数据科学项目可以对这种情况有所帮助特别是对于培训招聘人员和那些招聘部门的管理人员。

最后留给大家一个小问题:专业型数据科学家有很多, 但复合型数据科学家很少你可以说出哪些复合型数据科学家的名字呢?


作者:Vincent Granville

翻译:程思良语

原文:Vertical vs. Horizontal Data Scientists