担任数据科学经理的前半年,我学到了什么?

担任数据科学经理的前半年,我学到了什么?

在开始担任一个团队的数据科学经理的前半年,我做了许多其他人在面对新工作时会做的事情:我在Medium上搜索能帮助我适应工作的帖子。事实上,我没有找到很多关于数据科学经理的帖子(但这个帖子还是比较有帮助的:https://medium.com/data-science-at-microsoft/onboarding-to-a-data-science-team-2b735dae464。上面虽然有很多关于数据科学技术方面和如何管理数据科学项目的帖子,但没有那么多关于如何管理数据科学团队的帖子。所以,结合自身情况,我写下了这篇文章,希望能帮助到大家。如果你想了解更多关于数据科学的相关内容,可以阅读以下这些文章:
数据科学家应知的三个回归事项
提升数据科学水平的五个必备知识
使用Python和R的五个简单快捷的技巧——让你成为高效数据科学家
认识Julia:数据科学的未来

图片来自Unsplash,作者Astrid Schaffner

在这篇文章中,我将先写在工作后我面临的最大挑战:

  1. 适应非科技性的公司。
  2. 招聘和雇用(在某些情况下,与1相关)

当然,这并不是全部,但我想从这两条讲起,因为它们至少占用了我一天的四分之三。

关于我…

我其实对管理并不陌生,但最近一直在科技公司担任投资顾问。为什么呢?因为我确实是没拿到写编码,抠细节的工作。

哈哈,虽然我说我对管理并不陌生,但我的数据科学管理经验并不是尽善尽美。很久之前我管理过一个团队,又当人事又管项目。我的成员们每天都很快乐,坦白说,我有点嫉妒,没有和他们一起在那里敲键盘。

我还曾是一所R1大学的教授,做一些应用数据科学和机器学习的前沿研究。很多人不认为这是一份管理工作,但如果你仔细想一想,它确实是。虽然也要教学,但在一个R1大学里,研究还是占主导地位。

那这对于一个教授来说,首先,你需要通过写很多冗长的方案拿到资金,这也意味着你要证明你能管理好预算。其次,你需要招募一个团队。在鼎盛时期,我的团队有2个博士后,10个研究生,大约20个本科生。任何一个教授的研究小组的成功,在很大程度上,取决于他们能够招募到实验室的学生的质量。学生们都需要指导,都有不同的技能和经验水平,都需要定期对自己的表现进行评估并提供反馈,都有人际关系问题(有时这甚至会影响一个团队)。所以,作为一个R1的教授,我主要的工作是管理。当然了,我也会进行一些教学工作,这并不冲突。

那么,如果我这么喜欢编写代码,为什么还要回到管理层呢?我想这是因为我意识到,我也同样喜欢影响数据科学的方向。作为一名数据科学家顾问,你的日常工作(理想情况下)是解决有关问题、编写和审查代码以及记录你的工作。在我担任顾问期间,我发现我没有太多机会坐在桌前讨论出现的问题的业务需求,以及数据是否真的可以解决该问题。我没有能力推动数据科学工作的方向,我已经错过那些了。

基于此,我接受了我现在的工作:指导一个数据科学团队在滑雪产业(我爱这个产业)里大展身手。

图片来自Unsplash,作者Ian Schneider

关于我的公司…

滑雪产业并不是科技产业。这个行业可能已经存在了几十年,但它并不是由那些花很多时间去思考数据的人创立的。创立这个行业的人肯定对山脉很熟悉,但一般来说,这个行业不是以数据为中心建立的。

事实上,我最近的大部分工作是在技术层面。这对数据科学经理来说意味着什么呢?这意味着,我们在构建基础架构解决方案的同时,通常也在构建数据科学解决方案。我花了相当多的时间去研究一个科技公司的数据科学家可能认为理所当然的问题。

例如,我们应该使用什么样的云平台,使用什么样的工具(例如version control、CI/CD、cluster management等),把它们用在哪儿;对于我们堆积如山的数据,正确的存储解决方案是什么;(你看我在那儿都干了些啥…)当我们有大量不同的数据源时,即使是相同类型的数据,每个数据源都有自己的模式和噪声源,这些数据源必须去协同工作,那我们该怎么办?在科技公司,这些问题基本上都得到了解决,或很容易解决。

如果它们还没有解决,有一小群人就会努力解决它们。但在非技术领域,数据科学家必须是多面手,对全栈解决方案等方面的知识要懂得很多,而对一个主题的技术深度了解就少得多了。除了确定合适的平台和工具之外,我还需要能够将这些决策传达给业务部门,从价值方面和成本合理性方面跟他们讲得明明白白。

有时候我觉得这太难了。可有些时候,我又觉得这是一个很好的机会,能产生积极的影响。我特别相信,要想快乐起来,我必须转换视角去看待、去面对,体会到帮助团队的价值。

图片来自Unsplash,作者Eric Prouzet

到目前为止,我所面临的最大挑战是:雇用。

读到这儿,你也明白,找到一个合适的数据科学人才是非常非常困难的。数据科学家被比作独角兽(https://pubsonline.informs.org/do/10.1287/LYTX.2019.04.02/full/),需要学会很多专业技术领域的东西,包括编码、统计和业务技能。这意味着,公司对数据科学人才的抢夺令人难以置信地激烈。当我还是一名教授的时候,一位招聘人员向我推荐了一份金融科技公司的数据科学家工作,一年100万美元底薪,外加奖金,真的是如此。(但我没有去…我认为那种薪水的附加条件不值得我去)

FAANG公司(Facebook-Apple-Amazon-Netflix-Google)可以支付极高的工资,但大多数雇用数据科学家的公司都不是这样的。别误会我的意思!数据科学家还是可以过上很体面的生活的!但回归生活,非技术数据科学家,现实就比较骨感了。不幸的是,我在与FAANG公司竞争人才。

因此,我不得不在我的广告和招聘方面创意满满。数据科学家总是会在FAANG公司寻找工作,因为他们通常认为非科技公司不会雇用数据科学家。这意味着,我必须更加积极主动地推销我的公司(嗯,在LinkedIn上招聘很好用)。我还发现,在一些特别的在线论坛上招聘也卓有成效,比如Discord、Slack和Twitter。

但请记住:招聘数据科学家是一项快刀斩乱麻的工作,你得快点行动!你需要简化面试流程,快速识别人才。请仔细考虑你希望技术面试呈现的效果以及面试的持续时间。因为在不到一周的时间里,你的目标就可能从你手下被挖走!

各司其职

在我的团队中,我们既有数据科学家,也有机器学习工程师。二者的区别比较有争议,我的团队中也确实有过关于它们二者区别的讨论。以下是我以前的总结,我觉得比较中肯:

数据科学家:创造模型的人。

机器学习工程师(MLE,在其他地方也被认为是“数据工程师”):为数据科学家开发的模型创建管道的MLOps人员。

我可以告诉你的是,雇用数据科学家比雇用MLE要容易得多。去听讲解基本数据科学技能的课程很容易,很多甚至都可以在你的本机计算机或小型云容器上完成。然而,如果你仔细想想,让一个学生去访问包含大量数据的云管道,恐怕是又复杂又花钱。因此,找到一个有经验的MLE还是需要花点时间的。

关于升职方面,我们团队有三个等级:数据科学家/MLE、高级管理者和总体负责人。我现在正在更新我们的职位晋升方案。一般来说,我认为入门级角色是了解该项目的基础知识并能够完成分配给他们的特定任务的人。而高级管理者则是,在拥有一个项目时,能把它分解成一系列任务,然后取得突破。最后,总体负责人是那些能够自己发现问题、指导团队解决这些问题,并给团队创建解决方案的人。

另外,我需要使团队能够顺利完成工作,同时与其他经理和利益相关者合作,确定问题的范围,提出解决方案。大部分情况下,“经理/高级经理”和“总监”等角色之间存在着差异。前者主要是向下管理,处理团队的日常饮食等方面,而后者处于一个中间地带,又要向下管理,又要向上跟进。我现在的工作大概就是上传下达,各走一半。

给求职者的建议

  • 首先,认真阅读招聘广告,看看你能否胜任。例如,在上述职位描述中,你可能在之前的角色构建模型中担任过MLE。然而,由于这些职位名称模糊不清,在其他地方,你可能会被视为数据科学家。
  • 其次,FAANG公司希望你能在高压面试下给出他们想要的答案。博客里也有很多关于如何准备这种类型的面试的文章。面试可能会非常紧张,需要你几个月的学习去面对。但实际上,真正走到了岗位,你回答的那些不是工作常态也不真实具体的话没人会在意——你真的不会被期望在你的工作中发挥多么伟大的作用。你只需做好基本准备,简单一些,健谈一些。
  • 最后,正所谓“简”历,你必须把自己的简历写得简单明了,开门见山。不管你信不信,招聘经理看简历的时间都平均在6到7秒(如果你不相信我,请读一读这个:file:///C:\Users\lenovo\Documents\WeChat%20Files\wxid_s42witz5thkg22\FileStorage\File\2022-11\What%20I%20Learned%20in%20My%20First%206%20Months%20as%20a%20Director%20of%20Data%20Science.docx#:~:text=How long do employers look,for only a few seconds.。不要在简历上写太多没用的东西,比如铺垫性的话语。请单刀直入奔主题,如果你不知道主题,招聘广告会告诉你他们想要的是什么。
图片来自Unsplash,作者Elijah Hiett

总结以及我认为我在未来半年内可能会做的事情

在我上半年里,我的大部分时间都花在了有关数据科学的非技术性学习以及招聘和雇用上。我已经学会重新去看待数据科学和基础架构与整体业务的关系,以及如何向非技术经理传达投资回报率(ROI)。我还明白了在招聘时,一个既有创造力又积极主动的人有多吃香。FAANG公司可能不需要宣传他们在雇用数据科学家,但我需要。我能成功进行招聘,离不开在一些app上投放广告。

虽然我没有一个能预测未来的水晶球,但我认为我敢自信地说,未来半年会是什么样子。

  • 首先,虽然我很难确定最近的科技裁员会对我的招聘产生什么影响,但有些被解雇的人已经向我伸出了援手,所以我肯定我也在这一艘船上。
  • 其次,我真的不应该在提及“招聘”和“雇用”的时候,不讲清楚能不能把他们留下来。但话又说回来,留住人才还需要考虑到科技业整体就业环境的变化。
  • 最后,与任何人合作都不那么容易。所有管理者都有过这层考虑,这也是他们工作的一部分。

但是,我觉得,管理数据科学家还面临着一些独特的挑战。例如,这个领域发展得太快了,也许比其他软件开发领域还要更快。我刚开始做顾问时所用的“高科技”现在已经过时了,新型工具和方法在不断出现。在这日新月异的行业里永远立于潮头,一直是让我冥思苦想的事情。谁知道,就连这篇文章,什么时候又过时了呢?

感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

请拭目以待!

原文作者:J Sullivan
翻译作者:王文龙
美工编辑:过儿
校对审稿:Chuang
原文链接:https://towardsdatascience.com/what-i-learned-in-my-first-6-months-as-a-director-of-data-science-d9b7b98a48f7