Data Scientist 面经

Data Scientist 面经

面试过的公司

google, facebook, amazon, ebay, disney, Dow, hertz, target, lyft, Ford, starups, etc.

目标职位

主要是data scientistmachine learning engineer的职位但是各个公司也有不同的叫法比如decision scientist, research scientist, operations research, senior analyst, AI scientist 等等。

背景

Fresh PhD, 只有一次实习

先说一下职位之间的区别大概可以分为两种一种是偏向business, 平时工作主要是运用各种technique去解决business problem, 我个人比较倾向这种基本上每个公司都有这种职位另一种是偏向engineering以编程为主大部分只有高科技公司才有这样的职位。

基本流程

Step 0:

简历准备几个简单原则,(1)尽量用一页,实在放不下也可以多放我用的三页因为publications就有一页半),但是用多页还是要让人觉得你是真的做了很多而不是很空的两页这样第一感觉就不太好多页简历记得标页码。(2)重要的放在最前面,我的顺序:personal information(github, kaggle  link, linkedin 都可以做个链接放在这这因为很多pdf面试官可能会点这样就能让他们看你做过的项目和代码),availablity(什么时候可以上班),objectives, education, working experience, publications, conference proceedings, presentationseducation这个可以放到最后如果觉得不是很重要的话。(3)做过的项目尽量具体网申可以搜搜别人怎么写的不要只写我用XGB做了个classification这种公司更关注你发觉了什么insights整个process是什么结果怎样你是怎样解释结果的分为专业听众和非专业听众),可以问的很多绝不只有技术细节。

Step 1: 

内推, conference carrer center/carrer fair, 网申推荐indeed.com

Step 2: 

recruiter screening,这个比较简单就是简历被选中面试了简单聊一下背景

Step 3:

电面记得用耳机找个安静没人打扰的地方简历打印放在手边视频面试记得准备白纸以免面试官问问题需要写出来也可以帮助自己理清思路具体内容下面会归纳

Step 4:

code challenge, 这个不是CS那种coding test,而是给你一个case study,然后十小时的时间python/R去完成这个case study,估计这个是专门针对data scientist的面试并不是所有公司都有这个环节。

Step 5:

电面这个和之前的电面差不多有没有这一轮取决于之前的面试表现

Step 6 onsite:

大概是4~6轮不等也是最累的

面试题总结

统计,概率,机器学习,operations research 基本上所有概念要熟悉考的五花八门从基础的本科专业课到高级的研究生专业课都有可能考

建议去刷几门公开课我两个月基本上把能看的公开课都刷了一遍一定要很熟悉而且得有一定深度。

coding:湾区的公司都要考,leetcode简单或者中等水平,会分析time complexity。面过Facebook machine learning scientist,这是个纯马工职位基本上就是coding,如果面这个一定要刷题

SQL: 大部分考, hackrank感谢C神告诉我这个网站

R/Python: 至少精通一个因为data science challenge需要在很短的时间做出来类似kaggle,不过数据可能更dirty,而且有很多open questions

behavior question都是一些常规的网上搜搜都有

具体的问题实在记不得了反正啥都有可能问

编者的话:Steven是小编的好友,最近顺利找到了工作,在这里把面经贴出来,给大家共享一下。本文同时发表在米群网。

本文发布经Steven同意