四个数据科学求职者的常见失误

四个数据科学求职者的常见失误

在过去12个月里,我们帮一个公司的数据科学团队雇佣了大约10个新的数据专业人员。从实习生到高级职位,你能想到的各类申请数据分析师和数据科学家工作的个人简历都有。从这些求职者身上,我学到了很多东西,也希望能教会他们一些新东西。在整个过程中,我发现了那些没有成功通过面试的求职者的一些共同点。本文将对这些共同点进行详细介绍,教你如何正确应对常见的求职失误。如果你想了解更多数据科学求职相关内容,可以阅读以下这些文章:
数据科学家和数据工程师求职的5大区别
2021 Data Engineer求职必备技能
2021北美数据分析岗位求职:我是如何成功快速拿到Data类Offer的?
Market Basket Analysis:把握电商求职核心的购物篮分析是什么?

马斯洛锤(The Maslow’s Hammer)

在对求职者进行技术评估时,我从来没有要求过他们必须使用哪一种工具或编程语言来解决问题。因为我认为,在选择上保持一定的开放性,候选人才能用他们的创造力和实验来测试不同的方法。在大多数情况下,这是很有效果的,不过有时刚好相反。

好多次,应聘者都想用一种解决方案来解决所有的问题。一旦失败,就说自己没有办法解决这个问题。就像大家认为,每个聚类问题都可以用K-means解决;或者如果不能用Facebook的Prophet创建一个模型,就没有办法预测时间序列;再或者,简单地认为每个问题都可以用机器学习来解决。

那要如何解决这个错误?你需要关注的是问题本身,而不是目前正在使用的工具。可能每天都会有人要求你给出“一个解决这个问题的人工智能”和“一个预测这个问题的模型”;但你的要问的问题,不是“我应该使用哪种算法?”,而应该是“他们想解决的问题是什么呢?

出色的代码技能,糟糕的沟通能力

有时候(事实上大多数时候),我们需要把一个技术概念解释给一个非技术人员听,这并不是件容易事。但不管是解释度量的计算,还是模型的预测,其实,我们的大部分工作都是在沟通。

有时,利益相关者大都是外行。所以就需要我们找到跟他们之间共同的交流方式。

在一些应聘者中,我有注意到他们的技术很好,但传达出的效果总是不那么理想。而且,当我们问一些业务人员通常会问的问题,比如解决某个问题的方案时——他们总是抓不住要点,也没有办法解释为什么他们会选择这种特定方法。

如何解决这个问题:在选择解决方案之前,理由必须要充分,可以参照基准、以前的经验或实验——比如,你可以说“在测试的解决方案中,这个更好,因为ABC”。另外,还要了解你的解决方案存在的缺陷、缺点以及改进的方法。

杂乱的交流

这个话题基本上是上个问题的延伸。他们沟通失败的很大一个原因是,他们总想尽可能多地用编程来解决问题,而忘了讲故事。更夸张的是,我还收到一些的评论,他们把camelCase和snake_case代码混合在一起;还混合了不同的语言的注释等等。虽然,不能以此为标准淘汰某位应聘者,但这充分表明他缺乏一定的严谨性。

大多数情况下,缺乏讲故事的能力是指:应聘者在交替使用代码时,没有解释他们所用的方法。很多公司会先进行技术测试,然后再与团队初步对话,事实上,到这一步就决定了你是淘汰还是进入下一轮。

如何解决这个问题:从StackOverflow复制代码没问题,就连我自己一天也得做几次。但是,你必须要保持清醒,而且时刻提醒自己讲一个好故事。对于“好的代码不需要评论”这种想法,我持保留意见,当我们谈到数据科学家和数据分析师的工作时,像jupiter notebook这样广泛用于招聘流程的工具,给我们提供了一些不同寻常的东西:把故事与代码合并的可能性。

不知道公司是做什么的

这可能是求职者们会犯的一个最大错误,特别是对于那些申请数据科学职位的人来说。在这里,并不是说你需要了解公司的全部,但你至少应该知道,这家公司是做什么的。你可能会问,为什么这很重要?

去很多公司面试,你都会面临同样的问题。你会担任一个与业务相关的职位,了解公司是如何赚钱,主要竞争对手是谁,商业模式是什么,这是你与其他人竞争时突出优势的最起码的方法。

感谢你的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Paulo Vasconcellos
翻译作者:Lea
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/the-4-biggest-mistakes-of-data-science-job-applicants-20e67fdd0d0a