女性比例上升,阿三减少16%,Python占比激增…19年数据科学家求职都有哪些变化?

女性比例上升,阿三减少16%,Python占比激增…19年数据科学家求职都有哪些变化?

“数据科学家”一词在2008年由杰夫·哈默巴赫和DJ帕蒂尔创造,至今已有11年的历史。

从那以后,数据科学家连续四年成为美国最火热的职位(根据《哈佛商业评论》和Glassdoor报告等资料来源)。KDnuggets的读者对此非常了解。

即使考虑到所有因素,也很少有“明确”的途径来培养从事这一赚钱职业所需的技能。这就是为什么我们去年对1001个LinkedIn个人资料进行了研究,建立一个“典型”数据科学家形象的原因。这些结果在某种程度上也证实了其他研究和民意调查的正确性,比如每年一次的KDnuggets软件民意调查。但也揭示了数据科学家之所以成为数据科学家的其他有趣方面。

这项研究的不同之处在于,虽然数据是自我报告的,但我们是从求职者向雇主展示自己的方式中收集的。

方法

就像去年一样,我们调查了1001名数据科学家在LinkedIn上的个人资料。与招聘广告等其他收集数据的方法不同,我们认为专业人士自己发布的数据很好地反映了他们实际的简历。

我们必须保持同样的配额。因此,我们再次从《财富》500强公司和其他地方各获得40%和60%的个人资料。国家的配额也同理,40%来自美国,30%来自英国,15%来自印度,还有15%来自其他国家。由于数据可访问性的限制,我们采用了方便抽样。

总结

那么,如今的“典型”数据科学家与一年前相比有何不同呢?

乍一看,似乎没什么。该领域仍然由男性主导,自去年以来仅下降1%(2019年69% – 2018年70%)。我们这个群体中四分之三的人拥有硕士或博士学位(同样,这一比例明显下降);而这一角色的平均经验也从2年增加到了2.3年,仅增长了0.3年。

然而,一个值得注意的普遍变化是,去年数据科学家平均工作时间为4.5年,而今天这个数字是8年。这意味着,越来越多的人在更大的年龄或我们认为更有可能的情况下转行——统计学家、“数据采掘者”、计量经济学家和其他一些人已经“进化”(可能也获得了新的技能),并接受了他们职业的新名称:数据科学家。事实上,我们以前已经研究过该领域中的命名方式,您可以在这里找到详细的概述(https://www.kdnuggets.com/2018/06/what-where-how-data-science.html

然而,这并不是唯一的启示,当我们进一步细分数据时,我们遇到了关于2019年数据科学家的一些有趣的见解。

技能

可以说,数据科学家最重要的方面是他们拥有的技能。

在研究了每个数据科学家最看重的3种工具之后,我们发现,就像去年一样,编程语言在数据科学家工具包中被发现最多(与Tableau或SAS等软件相反)。

它仍然是领先的R和Python, 但在2018年,这两个占同样比重( 53%的数据科学家拥有这两个技能),但是现在,Python远超R (或者正如regory Piatetsky-Shapiro所说——Python继续侵蚀R)。54%的人把Python作为他们的顶级技能之一,只有45%的人提到R。

对于我们的参与者来说,SQL是一个固定的第三选择(36%)(仅比去年下降了4%)。从2018年开始,前六名中的最后三种语言并没有改变。MATLAB和Java的用户甚至与去年持平(分别为19%和18%),但是,我们确实观察到C/ c++程序员的用户减少了10%(18%到8%)。

最后,去年我们研究了行业的技能集,因此重复这种分析也是有意义的。就跨行业的语言分布而言,我们观察到的结果与2018年的趋势非常相似。主要的收获是,即使在这个细分中,结果本质上也反映了我们所看到的总体偏好——Python主导了所有行业。

行业的就业

数据科学家的最大雇主仍然是技术/IT行业,自去年以来增长了1%(2019年增长43%,2018年增长42%)。然而,尽管科技仍然占主导地位,工业领域的数据科学家也在增加,从37%上升到39%。金融业的比例保持在16%不变,而医疗行业的数据科学家比例从5%降到了2%(当然值得注意的是,与其他行业相比,医疗行业是一个微不足道的小群体,所以这个比例的下降可能完全归因于抽样限制)。

这些结果并没有特别显示出数据科学家所期望的领域逐年发生的巨大变化,但如果我们看看这些按国家划分的行业会怎样呢?

与去年一样,除了英国比其它国家更偏爱金融业以外,大多数国家的业绩与总体水平相似。尽管对作为欧洲金融中心的伦敦来说,前景尚不明朗,但英国的金融机构似乎在数据科学方面投入了大量资金。

然而,最显著的变化来自印度,印度科技行业的数据科学家人数从63%大幅减少到平均47%。其中一些进入了工业部门,现在雇佣了30%的印度数据科学家,高于21.4%。但看起来印度已经向英国学习了一些,他们的金融业获得了13%的数据科学家(2018年为8.3%,2019年为21%)。众所周知,印度已经主导了科技界,许多公司将业务外包,数据科学也在效仿。继续关注印度这一领域的发展无疑是我们所期待的。

结论

这项重复的研究重申了成为一名数据科学家所需要的条件。随着Python和R之间的差距不断扩大,数据科学家所需的编程语言比以往任何时候都更加清晰。这是对有抱负的数据科学家的又一次“检查”,帮助他们明智地选择关注哪些技能,取决于你打算在哪个国家和行业工作。

从2018年到2019年的变化似乎没有研究人员想要的那么具有革命性,但它们确实证实了已经在发生的趋势。随着数据科学比以往任何时候都更加强大,我们希望在数据科学家的简介中看到更多的稳定性和更少的惊喜。虽然距离一个成熟的领域还很远,但数据科学仍在不断发展,跟上趋势和模式和以往一样重要。

原文作者:Iliya Valchanov

翻译作者:Vera

美工编辑:Miya

校对审稿:卡里

原文链接:https://www.kdnuggets.com/2019/03/typical-data-scientist-2019.html