资深数据科学家面试entry level 数据科学家时,会问那些问题?
Springboard里收录了Matt对数据科学面试的指导面试记录。同时,Matt也是Springboard数据科学职业导向性Boot Camp中的一位导师。
Matt Fornito是Summit Analytics的董事长和创始人。他有数十年的数据科学家,导师,和面试官的经历,曾在Target, SportsAuthority和Dish Network公司中任职。
Question 1
Q: 你在招聘的时候最看重应聘者的哪些特质?
A:
我个人比较偏爱有理科背景的,能够学习编程的人。还有的就是,我更愿意接受研究生学历和博士学历的人,因为我觉得仅本科毕业想在职场上获得成功还远远不够;本科毕业这个要求要求对大多数人来说还是相对比较容易的。那些对于打码能很快上手并且善于交流的应聘者比较能抓住我的目光;想要达到这一点,得先透彻理解这些技术问题并且可以很好地把涉及到的概念很好地表述出来。数据科学家与数据分析师最大的区别就是数据科学家所具备的理解问题和解决问题的能力。
在研究生和博士学历中,我比较偏爱数学,统计,化学,物理,生物信息和工程专业的,其中也有一小部分MBA的学生。我自己本生是组织心理学的博士,所以尽管我更倾向于招STEM(Science Technology Engineering Math)专业的人,这也不是一个硬性的限制。
Question 2
Q: 能不能给正在经历数据科学领域面试的人一些好建议呢?
A:
招生官会看申请者的简历上写的教育水平,最近的两份工作,以及这两份工作所在公司的实力。HR们只会迅速浏览申请者的简历,所以你得在几秒之内迅速展现你自己。说一个建议吧,要么去个big title的大公司,或者去创业公司拿一个high position;这可以让你更轻松地在数据科学的招聘筛选中脱颖而出。
招生官一般会问你一些类似于“跟我说说你做的这个project”的问题。这个问题通常意味着HR想知道你构建这个project的全过程,包括在你的project中你使用了哪些数据,你用了什么language,project的结果是什么;所有这些问题的答案在你的面试中都要清楚地表达出来。一个成功的面试者会对自己的这些经历有充分的认知,并能够像讲故事一样像面试官讲述自己的经历,最后会再阐述他们做的事情是如何影响整个business的。
Question 3
Q: 那你作为面试官,你是想考应聘者什么呢?
A:
在面试中,我提出的问题会与一个是否能够体现应聘者问题解决能力和交流能力的project相关。我也会评估这个应聘者对于我们公司和数据科学领域是否有足够的热情。对于我们来说,在某个领域保持持续学习的动力以及对问题解决的热爱是区分面试者水平的关键。从技术层面来说,我更愿意看到应聘者用Hadoop和Spark优化数据以及他们在不同数据科学解决方案中如何权衡利弊。通过我的面试,我希望我能得到关于“他们觉得自己像一个数据科学家么?” 以及“他们能把数据科学的工作做成什么样?”的答案。
之后呢,我会开始问一些数学问题,比如梯度下降,统计方法和随机森林等问题。我还会提出一些情景题。我会让应聘者置身一个特定的条件下,看他如何去展开这个工作,如何去面对客户并解决相关的问题。我个人对于Python 和 R 的要求比较高,但是对于C++和Java就没有那么严格的要求。比起HackerRank这种结果导向型的刷题模式,我更愿意去测试应聘者是否具有学习新的编程语言,并且快速学会的能力。每一个我选中并聘用的人都一定会具有适应性的潜在能力,这也是我最看重,并且在面试中测试的东西。