抛弃幻想,谈谈现实中的数据科学家
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it — Dan Ariely
神奇动物在哪里:数据科学家和数据工程师大揭秘!
人们对于大数据和AI究竟是什么总是含糊不清并有很多困惑,“数据黑箱子”的技术性让那些分析巨大数据集的人变成了某种神秘人物。这些有着技术和意愿去分析数字并据此提供见解的人通常就被叫做:数据科学家。
资深数据科学家面试entry level 数据科学家时,会问那些问题?
pringboard里收录了Matt对数据科学面试的指导面试记录。同时,Matt也是Springboard数据科学职业导向性Boot Camp中的一位导师。
数据科学的新生代工具(附实操代码)
自从“数据科学”进入人们视野以来, 它一直被用来形容处理那些一台电脑装不下的大数据。所以,处理大数据的能力被认为是数据科学概念的核心。虽然Mapreduce依然是基础工具,但很多新涌现的有趣工具已经超越了它的基本功能。比如说,Mantel-Haenszel 计量就无法在基本的Mapreduce中运行。Spark和Google Cloud Dataflow正是下一代数据处理体系的代表。本文将结合笔者的第一手经验和调研对两者进行比较。
如何建立数据科学和数据工程团队?
数据科学和数据工程团队该如何建立?比如,是否有与数据科学配对的“数据工程”团队这个概念?还是数据科学家和数据工程师都属于“纵向”产品团队?数据科学与工程团队如何互动?数据科学的工作如何与数据工程协调?数据科学家与工程师之间的责任分工如何?有没有混合角色的概念?