FB, Uber, Airbnb等数据岗面试分析集锦

FB, Uber, Airbnb等数据岗面试分析集锦

顶级数据科学团队的面试是什么样的,以及如何加入他们的团队?本帖汇总分析了所有你可以从Google, Airbnb, Facebook, Uber和其他公司的面试过程学到的知识集锦。

              顶级公司数据岗位面试集锦分析

应该为面试做哪些准备呢?

根据我们所了解的信息,我们把面试的准备过程总结为六个要点:

第一:调查,调查,调查

花时间去了解每个组织的数据科学团队正在开展的工作,这使你可以在面试过程中做得更多,也更好地和未来的同事交流。你会被问到很多情境问题,以及与公司当前工作相关的产品的问题。例如有关LinkedIn上的你可能认识的人的推荐系统的问题,或者如何把Uber司机与乘客匹配的问题。

第二:准备四类数据科学问题

统计和概率问题,编程问题,商业思维问题以及公司文化工作岗位的适应问题。

第三:练习统计建模/推理

学习如何描述机器学习的概念,在一定的时间约束下,用 SQL,R和Python进行基础操作和高级操作 。数据科学面试过程在不同公司之间都是非常标准化的:电话面试,笔试,然后公司现场面试。你需要确保面试和那些有时限的作业都能顺利进行。在一定时间限制下练习使用SQL,R和Python,因为很多在家里完成的笔试任务的目的都是用非常少的时间来测试你对这些语言的熟悉程度;如果你没有准备好,这些情况都会让你措手不及。

同时,对这些公司来说,展现你能快速思考Hadoop这些框架的能力是让人印象深刻的。但也不要忘记最基础的知识!有时候,公司会以基本的统计问题以测试你的工作能力。

第四,得到内部推荐机会。

在我们调查的九个公司里面,四个公司(Google, Uber, Facebook, Airbnb)把内部推荐当成面试邀请的第一来源。总体来说,内部推荐是面试邀请的第一来源。这说明你需要认识公司里的人,并让他们推荐你,而不是只是网上申请。

第五,准备你的故事。

你会被非常详细地问到你过去的工作。做好把过往经历和工作描述的尽可能详细的准备,从你用过那些工具,到为什么你做出不同的决定。准备好一个连贯的故事来告诉面试官你曾经做过哪些惊艳的事情来提高你过往公司的业务结果。

第六,准备打一次长期的拉锯战。

整个面试过程可能花几个月来进行几轮不同测试。确保你准备好了漫长的等待过程。
除了以上的六点,我们认为数据科学面试过程是一个复杂的怪兽,需要我们用精确的行动和无数的练习来打败。

数据科学面试有哪些问题呢?

第一、统计问题

统计和概率往往是数据科学面试中的“主食“。这些问题的目的是测试你的思维和你如何在有不确定性下进行推理。这是一个数据科学家需要掌握的基本技能。
这一篇文章可以帮助你了解一些统计和概率的问题:How Bayes Theorem, Probability, Logic and Data Intersect
这本书可以帮助你了解一些统计和概率问题: Think Stats, Probability and Statistics for Programmers 
这是一门有互动性的课程,可以帮助你了解一些统计和概率问题: Probability and statistics with KhanAcademy

第二、编程问题

如果统计和概率是数据科学面试中的“主食“,那编程问题就会是“配菜“。数据科学需要大规模处理数据,这需要编辑程序来自动处理所要求的大量的工作。
一篇可以帮你解决编程问题的文章:Data science sexiness: Your guide to Python and R, and which one is best  
一本可以帮你解决编程问题的书:Cracking the Programming Interview
还有一门Data camp的课,帮你解决编程问题:Intro to Python for Data Science

第三、商业思维和案例研究

第三个数据科学面试板块是:解释你的研究结果,说明你的研究发现可以如何驱动商业行为和结果 。这些问题测试了你对观察到的商业行为的原因的思考。
有一篇文章,以帮助你解决商业思维和案例研究问题:Tips for Data Scientists: Think Like a Business Executive
这里有一本书,以帮助你解决商业思维和案例研究问题:Data Science for Business
还一个互动课程,以帮助你解决商业思维和案例研究问题:Data Analytics for Business

第四、文化/角色适合问题

第四类问题主要集中在您是否能够适应招聘机构的角色和文化。对待这种行为问题的方法是诚实地表达你的想法。

顶级数据科学团队如何面试?

我们决定更深入地了解一些我们认为可以高度代表不同行业的数据科学团队– 从Google到LinkedIn。在Glassdoor上有大量的数据科学团队面试的评论。这些评论允许我们能够深入探讨他们的面试过程。

根据Glassdoor的受访者反馈,在面试过程中, Google面试的难度最大,而摩根大通的难度最小。谷歌面试的挑战不仅在于问题的数量,还有面试官的数量。
在113个Glassdoor的受访者的样本中,44%的人通过网申拿到面试,大约33%的人通过内部推荐拿到面试机会。因为我们知道得到内部推荐有很高的障碍性,所以这是为什么大多数人选择网申。这个事情同时也也说明了内部推荐的重要性。

拥有最高的积极反馈的公司是Google。大约60%的受访者说他们拥有积极的面试经历。对比之下,Yelp和JP Morgan拥有0积极回馈,尽管我们这两个公司只有9个面试评论样本。
我们发现我们之前的使用内部推荐渠道获得面试的学生比通过网申的学生多出八倍。

Facebook的面试时怎样的?

几乎大多数面试过程是积极的, 49%的受访者表示他们有一个愉快的面试经历,只有23%的受访者认为他们没有。大多数候选者是通过当前员工或招聘官推荐的。在1-5的比例中,整个Google的面试过程的难度被评定为比平均水平高一点:3.4分。其中5分代表最高难度。

面试过程包括一轮电话面试,一轮在家里完成的数据知识笔试,一轮屏幕共享的SQL的笔试和一轮公司现场面试。公司现场面试要求和团队中的每个人都进行一次1对1的面试。在整个面试过程的前期,问题多集中于SQL, 之后多集中于机器学习和建立Facebook的广告模型。开放性的场景问题多数是关于产品管理和数据科学,包括问题如怎么设计一个具体的Facebook的属性。
根据描述,面试等待过程平均长达3个月,所以不用惊讶你需要花一段时间等待下一轮的结果。

Facebook数据科学团队正在开展的工作:研究团队分享了他们目前正在做的工作:包括关于推动新的周期的研究,和人们如何在社交网络上互动的深度分析。

Uber的面试时怎样的?

Uber数据科学面试有些负面反馈,有61%的评论者说他们没有一个开心的经验。大量参加面试的人都是通过网上申请,与通过内部推荐获得面试的人数相同(35%)。面试过程的难度被评定为3.1。

面试过程是标准化的:一轮电话面试,一轮2个小时的限制的笔试(分为SQL分析和一些操作简单数据库并回答的开放式问题),然后一轮现场面试—混合了技术问题和行为问题。
技术问题围绕Uber的产品:你会被要求处理泊松分布,时间序列分析,以及用算法让驾驶员接受预订等问题。 Uber的数据科学团队专注于优化一个乘客与驾驶员之间快速和省时的互动。他们的面试也是根据这个工作需求设计的。
Uber的数据科学团队正在做什么:这篇文章是Emi Wang,一位Uber当前的员工介绍的Uber数据科学团队的日常工作。他们的工作在编写代码,做业务分析和为新项目创建模型中交替,包括通过Geosurge调整供应和需求;Geosurge是Uber动态定价的内部系统。

LinkedIn的面试是怎样过的?

Linkedin的面试经历积极反馈是消极反馈的两倍。很多候选者是通过网申获得面试邀请,所以可以试一试自己的运气!整个Linkedin的面试过程的难度被评定为比平均水平低一点:2.8分。

一位领英的招聘官说,面试过程包括一轮与招聘官的电话面试,一轮与团队领导的电话面试,然后一个现场面试。大多数候选者会收到一个长达3到4个小时的在家里完成的数据科学作业。

Linkedin的面试问题大多围绕你对Linkedin产品的兴趣,例如如何推测员工的工资,或者如何从事一些已经建立好的属性(你可能认识的人)。Linkedin团队非常看重Python和机器学习,尽管这部分知识会出现在面试的后期。前期还是多通过SQL和数据挖掘的问题来淘汰部分不合格的候选者。
Linkedin数据科学团队正在开展的工作:前Linkedin产品数据科学主管Daniel Tunkelang大概描述了每个人在团队里面的角色,以及团队在2012年的主要工作:包括更新社交圈,使其与用户更加相关,并更能代表用户的职位头衔。

Twitter的面试是怎样的?

Twitter的面试经历反馈有45%为中立,27%为积极,27%为消极。大多数申请者是通过网申拿到面试机会。Twitter的面试难度被评定为3.5,所以准备好要接受挑战。

受访者认为面试结果回复得非常快,但是这个面试过程还是非常长的。首先是一轮网上的编程笔试,然后是两轮电话面试,一个关于编程,一个关于统计推理。之后公司现场面试包括两个Skype面试,一个关于数据科学,一个关于编程。

编程问题都是非常经典的软件工程的面试问题,但是Twitter的数据科学面试多数集中在开放性题目和与Twitter现在的工作相关的问题。候选者被测试到A/B测试的相关知识,同时他们用collabedit.com平台来做远程的编程笔试。一个候选者说他收到了很多白板问题 来测试他的机器学习理论和算法设计等知识。
Twitter数据科学团队正在开展的工作:这篇文章是一个在Twitter工作了两年的数据科学家分享的个人经历。文章记录了部分工作:包括研究为什么某些国家有更高的多个Twitter帐户的比率和可能涉及的因素,以及有多少用户有资格获得不同的通知类型。

Airbnb的面试是怎样的?

36%的Airbnb面试经历是积极,27%是负面的。大多数面试邀请都是来自员工推荐:这一点看出Airbnb对他们内部推荐系统有强烈的权衡。面试的难度评分为3.5分。

面试过程的有少数公开的详细描述的数据,其中最有参考价值的是由Airbnb的数据分析主管公开的。他描述了先通过电话面试过滤部分申请者,之后是基本的数据笔试,之后是内部数据破解,然后是四次面试。这四次面试主要侧重于文化适应和与业务伙伴沟通的能力。

Glassdoor上的评论证实了整个面试过程是恰当的。在家里完成的数据笔试主要侧重点在于A/B测试和结果的显著性。之后的公司内部的数据测试主要侧重于统计建模。尽管测试非常基础,但是给的时间非常少,所以你必须非常熟悉Python和R以便于能在极短的时间内最好地完成测试。Airbnb数据科学团队和别的数据团队不同的一点是,他们非常关心候选者对Airbnb产品的想法以及过往的使用经历,所以务必准备好一些关于Airbnb应用程序使用体验的问题和你对产品的想法。

Airbnb数据科学团队正在开展的工作:部分资料描述了数据团队如何在Airbnb整个团队中实现数据驱动型文化。

Yelp的面试是怎样的?

大多数人在通过网上申请得到Yelp的面试邀请。 面试过程的难度被评为略高于平均水平,为3.3分。

整个面试的过程如下:一轮限时的网上数据笔试,一轮电话面试,最后是一轮现场面试 – 分别与4个人面对面的面试。

Yelp的企业文化相当开放,员工自豪地分享他们使用的不同的工具,这一点和谷歌相似。 Yelp数据科学面试问题是相当标准化的。

Yelp数据科学团队正在开展的工作:其中一个是团队如何用深度学习对餐厅图像进行分类,以区别它们是食物的图像还是餐厅的内外部装饰的图像 。

Google的面试是怎样的?

大多数Google面试经历都是积极的,60%的受访者反馈了积极的体验。 员工推荐是获得面试的最佳方式,50%的受访者声称这是他们的获得面试的途径。 面试过程同时也被评为是所有面试中最难的:难度等级为3.7。

最开始是一轮集中于技术的电话面试,然后是一轮高强度的现场面试—分别与谷歌的几个当前员工进行长达一个小时的面试。 电话面试混合了基本的计算机科学问题和统计问题,重点集中于R/SQL 。现场面试问题侧重于如何切割数据。

Google的数据科学团队正在开展工作:这篇“非官方”的Google数据科学博客分享了团队正在开展的大量项目,包括如何成为Google数据科学团队一员的初级课程。

J.P. Morgan的面试是怎样的?

摩根大通的候选人主要来自校园招聘,网上申请和招聘官招聘。 面试难度低于平均水平:为2.7分 。

这个过程开始于一轮30分钟电话面试,其次是与招聘经理和一个团队内的高层管理者的视频面试,最后是与几个人面对面的面试。 摩根大通的面试主要侧重于金融知识以及机器学习。 他们还强调与业务团队的沟通,要求候选人向非技术团队成员解释什么是线性回归。

摩根大通的数据科学团队正在开展工作:摩根大通使用Hadoop获取大量的客户和交易数据,并将其与社交媒体提及的内容结合起来,从而获得对他们所服务的客户的完整认识。

数据科学的世界拥有巨大的潜力,大多数公司希望利用他们的数据产生的洞察力来助于他们在21世纪的经济前沿进行竞争。 通过我们的分析,我们希望你能够将这些知识转化为可操作性的行动,打造你的数据科学职业生涯,并打破加入顶级数据科学团队的壁垒!

原文作者:Roger Huang

翻译:Kristin Chen