如何准备DS数据科学家面试?
# 引言 #
网络上有很多数据科学的面试指南,大部分指南都关注于机器学习算法概念,但很少有人强调与同事交流的重要性,以及数据科学对业务的影响。当然,候选人需要掌握这些重要概念和技能,但同时也需要关注数据科学中技术含量较低的方面。因此,下面我将概述三个实践领域,可运用到你的数据科学面试准备过程中。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
Facebook和Microsoft数据科学家面试,他们会问这些SQL问题
如何用数据分析优化你的营销策略?
电商零售业是怎么运用数据分析的?
Data in HR Management:商科社科人文科数据分析求职新方向–人力资源管理
# 与利益相关者协作 #
通常,数据科学家是帮助企业实现业务最终目标的团队中的一员,而这些目标是与产品或客户有关的。学校或数据科学教育中通常没有包括利益相关者合作的概念,如果你没有从事过数据科学工作,那真正上手时就会变得困难。但是,你仍然可以通过其他方式了解与利益相关者协作的核心。
首先,让我解释一下什么是利益相关者。根据我的经验,利益相关者在这里是指分配任务的人,他们会最终决定你模型投入生产是否批准。利益相关者通常是产品经理,但实际上也可以是任何人。甚至,这个人还可以是你自己,在这种情况下,了解一些建议可能还是很有用的。
以下是与利益相关者协作的 3 种可行方法:
- 向没有数据科学背景的人解释数据科学
- 了解可能会与你交流的各类利益相关者
- 了解数据科学对业务的影响
我想首先强调这些内容,这样读者更能容易理解这篇文章。现在,让我们深入了解每一部分。
对于第1点,你可以试着解释决策树(decision tree)是什么——这个概念是很多机器学习算法的一部分,如果你能成功解释这个概念,就意味着你已经获得了多项技能。如果将概念可视化,并将其分解,就能更容易理解了。你还可以分析分类(Classification)与回归(Regression)之间的差异,并提供真实示例。例如,根据特征对动物群体(名称)进行分类,或根据过往数据预测连续销售值。
对于第2点,正如我上面所说,利益相关者中最常见的就是产品经理。因为,他们中的大多数人都有技术经验,并且可能也了解 SQL。其他职位可能包括软件工程师、数据分析师和高管或高层领导。
对于第3点,你构建的数据科学模型的准确度可能为 99% ,但如果它不能通过帮助客户或节省资金等方式影响业务,那么这些模型就没有意义。尽管如此,数据科学家最好还是对常见的正向业务指标有一定的了解,我们通常称之为关键绩效指标 (KPI),下面我将详细讨论这类指标。
因此,在面试时,请确保你提到了与利益相关者的协作经历,即使这些经历与工作经验没有直接关系,你还是可以举简单的例子,简单到家人或朋友,都可以通过例子了解数据科学概念,这些都可供面试官作参考。
# 关键绩效指标(KPI) #
数据科学算法有自己的正向指标,例如准确度、精确度、召回率、平均绝对误差(MAE)、平均绝对百分误差(MAPE) 和 均方根误差(RMSE)等。但是,还有其他的正向指标,这些是数据科学模型对业务的影响。这最终取决于你申请的公司是什么类型,但是,如果你对更关键的 KPI有一定的了解,你就可以将相同的想法应用到其他行业。
以下是一些 KPI 示例:
- 单个客户收入
- 单个客户点击量
- 单个客户成本
- 单个产品收入
- 月收入
KPI 最重要的方面在于,KPI会根据你的数据科学模型发生变化(增加或减少),如果你可以对模型进行 A/B 测试,正确评估效果,那么你的面试结果就会更好。不仅是数据科学家需要分析KPI,产品经理、数据分析师和其他人也同样需要。
# 文化契合(Culture Fit) #
最后,也许表面上看,文化契合与数据科学没有直接关系。但我仍然认为,文化契合是面试中最重要的部分之一,我个人希望,候选人不仅要了解数据科学,而且可以清晰地向他人解释其内容,并且与团队相处融洽。
数据科学的特点是准确性和误差。数据科学模型很难理解,指标更是如此,而且这些指标每天都在变化,所以,重要的是你要意识到这种变化,并将其清楚地传达给其他人,而不是避开这些变化。
总的来说,诚实是最好的品质,数据科学家可以在面试中通过展示自己了解的内容和不了解的内容,从而体现自己诚实与否。不了解一切并没有错。比起让别人发现你不知道,诚实告诉别人你不了解的内容,这种方式更值得称赞。以下是一些数据科学面试中需要考虑到的与文化契合有关的注意事项:
- 遇到不了解的内容,保持诚实和开放
- 面试开始前,研究公司价值观
- 研究你的同事/公司,表现出自己很感兴趣(如果你对公司感兴趣)
总的来说,当你在面试时,不要忘记你也是在认识这家公司和它的数据科学职位。你要确保自己适合这家公司以及这个职位。
# 总结 #
关于数据科学面试准备,你要学习或准备的内容非常多。很多文章只与技术内容有关。虽然技术非常重要,但通过将软技能和业务概念投入实践,并在数据科学面试中展示出来也非常有用。
总而言之,在下一次数据科学面试之前,你需要练习或应用以下三个重要概念:
- 1. 与利益相关者协作
- 2. KPI
- 3. 文化契合
希望我的文章可以让你觉得有趣的同时还非常有用。不论你是否认同这些数据科学面试的准备技巧,都可以随时在下面发表评论。为什么认同,或者为什么不认同?在数据科学面试准备方面,你认为还有哪些重要因素?我们可以进一步讨论这些内容,希望我能够为你提供一些为面试做准备的方法。
感谢你的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/
原文作者:Matt Przybyla
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/top-data-science-interview-prep-7089d0df2b27