Google 数据科学家面试全纪录

Google 数据科学家面试全纪录

Google是美国的一家科技巨头公司,致力于打造互联网相关的服务与产品,包括在线广告、搜索引擎、云计算、软件和硬件等。谷歌成立于1998年,总部位于加州山景城。

Google自2002年成立以来迅速发展,开发了一系列产品,收购了许多公司,并通过在搜索领域的主导地位成为了主流文化。Google现在已经扩展到更多产品和服务当中了,比如办公应用程序,电子邮件客户端,云计算,视频聊天,android等等。

谷歌提供了这么多的产品和服务,而且还拥有惊人的用户量,那可能有人会问,谷歌到底能处理多少数据呢?

根据2019年的统计数据显示,谷歌平均每秒能够处理超4万次的搜索查询,相当于每天超过35亿次搜索,全球每年1.2万亿次的搜索[2]。

对Google而言,这些都会给Google的客户增长与扩充带来无限机遇,同时也为数据科学家们提供了一个可供分析解读的信息库,来帮助Google识别自身与客户的机会,打造属于Google的商业和技术战略。

如果你对谷歌在面试中的会问到的问题感兴趣,可以看看Google数据科学面试的问题列表!如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
Google Product Analyst 面经详解
100000万奖学金!Google宣布为数据分析、项目管理和用户体验领域在线证书发钱啦!
Google 官方 Channel 盖戳:谷歌面试官眼中的优秀简历长什么样?

Google的数据科学职位

从增强广告效果,到优化网络基础设施,Google数据科学家的工作会涉及到团队、产品和功能的方方面面。

Google数据科学家的主要工作,是对指标(metrics)和实验(experimentation)进行分析。这与Google的机器学习和产品分析师截然不同,另两者会更专注于工程(engineering)和产品方面。

在用数据科学家这个名称吸引更多人才之前,谷歌数据科学领域的职位曾被称为定量分析师(quantitative analyst)

其他相关资历要求包括:

  • 统计学、计算机科学、生物信息学、计算生物学、工程、物理、应用数学、经济学、运营或相关定量学科的硕士或博士学位,或者具有同等实践经验的。
  • 统计学软件(如MATLAB, Panda, Colab, S-Plus, SAS等),编程语言(如Python, R, c++, Java等)数据库语言(如SQL)和管理系统方面有高级经验。
  • 具备使用大数据和在云平台部署大型数据科学解决方案的经验。
  • 数据科学方面有业务分析(business analytics)经验,在设计和建立统计模型(designing and building statistical modelling)可视化(visualization)机器学习(machine learning)数字归因(digital attribution)预测(forecasting)优化(optimization)预测分析(predictive analytics)方面有一定经验。
  • 有先进的统计理念和应用大型数据集机器学习的经验。
  • 具备构建问题、解决问题、项目管理和人员管理技能。

Required Skills必备技能

Google通常只会雇佣在分析学或相关领域至少两到三年,有丰富从业经验的人。但确实也有针对数据科学领域的实习生和大学毕业生的计划,对于新博士毕业生来说,有更高阶的职位。

Google的数据科学团队

从市场营销部到Google Research的研究团队,数据科学家们利用高级分析、机器学习理论、和统计学的概念和方法来确定产品的开发并改善客户的体验。

Google的数据科学家最常接触的团队有:

  • 工程与设计(Engineering and Design):应用高级分析反复构建分析管道(analysis pipelines),提供大量的见解,同时与不同的团队进行跨职能合作,提出对业务有影响力的建议。
  • gTech专业服务(gTech Professional Services):通过对技术的实施、优化、和关键性的解决方案来帮助客户实现广告业务目标。
  • Google Maps核心指标(Google Maps Core Metrics):开发核心指标的同时研究实践,制定衡量谷歌地图的用户粘性、采纳率和留存率的标准。
  • Geo:在大型Geo数据集上应用高级分析工具,构建制作分析管道的原型,研发用来分析、预测和优化的方法,并在不同层次上给出业务建议。
  • 运营和支持(Operations and Support):同工程师合作分析、解读数据,制定衡量结果的标准,并把新工具运用到用户支持与运营当中。
  • 广告(Ads):利用统计研究和机器学习的概念,来构建和扩展Google的广告能力。
  • 搜索广告(Search Ads):设计与分析复杂的实验,了解一项变化对系统的影响,并提供改进建议。与分析师和软件工程师(SWE)在核心算法上进行合作,改善用户体验。
  • 商业策略(Business Strategy):与跨职能团队合作,了解他们的业务需求,从而提供有意义的战略建议。

Google面试流程

谷歌的面试流程是从提交申请后,招聘人员用电子邮件向你发送预筛选问卷开始的。在这之后,你会接到招聘人员的电话,他们会与你探讨你的个人兴趣和相关经历。

这次面试结束后,招聘人员会安排你跟某位数据科学家或招聘经理进行电话面试,时间通常为45到60分钟。完成后,接着会安排五轮单独的现场面试。

初始筛选

最初的筛选通常是和招聘人员进行30分钟的电话面试,他们向你会描述工作岗位、工作职责,然后是Google的各个团队展示,最后再问你是否愿意从事数据科学家的职位。这轮面试过程中,你可以和招聘人员多聊天,让他们更了解你的技能。

招聘人员主要是想弄清楚你的职业规划,然后把你分配到符合Google公司文化和价值的某一团队中去。

  • 描述你过去做过的某个数据科学的项目。
  • 你遇到了什么样的问题?如果数据不同,你会使用什么方法?
  • 一个统计(计算统计)问题或因果推理问题
  • 在共享代码编辑器上的编程问题

技术筛选

Google的数据科学家技术筛选是通过与一个数据科学家的视频会议(Google Hangouts)进行的。

这一过程的面试是围绕实验设计、统计学和一个概率编编程题展开的。

这一过程还会涉及更多的技术讨论,讨论你过去的研究和工作经验,并深入探讨你经历过的问题以及解决这些问题的技术方法

你可以从Interview Query上找一些中等水平的面试问题做练习。

Google现场面试

现场面试是Google数据科学家面试过程的最后阶段。

这是与数据科学家进行的5轮一对一面试,涵盖了计算统计(computational statistics)概率(probability)产品解释(product interpretation)度量和实验(metrics and experimentation)建模(modeling)以及行为问题(behavioral questions)

每轮面试大约45分钟,中间有午餐和休息的时间。

以上就是谷歌数据科学家面试的介绍和过程,感谢您的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

参考文献:

[1] Google Wikipedia Page 

[2] Google Search Statistics

原文作者:Jay Feng
翻译作者:Lea
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://towardsdatascience.com/the-google-data-scientist-interview-731d01d27859?gi=124aeb820105