数据科学家六大常见错误
我是夏洛克·福尔摩斯。我的工作就是去了解那些其他人不了解的事情。
——夏洛克·福尔摩斯
2. 不够重视沟通
3. 毫无目标(或计划)地分析数据
4. 阅读量不够
5. 简化不当
6. 不擅安利自己
1) 对于分析工具的关注度高于对于问题本身的关注度
工欲善其事,必先利其器。
——孔子
2) 不够重视沟通
历史的经验告诉我们,一个很粗糙的工具在熟练的工匠手中打造出的作品会往比从新手手中精美的仪器打造出的作品更美好。
——卡尔·培生
最重要的事情往往难以启齿,因为言语会缩小它的重要性。
——史蒂芬·金
像智者一样思考,像常人一样交流。
——威廉·勃特勒·叶芝
3) 毫无目标(或计划)地分析数据
结论和假设的区别在于假设是需要事实来检验真伪的。作为数据科学家,我们要客观对待自己的假设。我们更应该寻求真理,而不是寻找支持自己分析的证据。而且,在分析时,我们肯定会找到一些与假设无关的线索。我们要做的是像侦探一样基于这些线索来撰写我们的故事。尽管如此,带着清晰的问题分析对于数据科学家来说是非常重要的。
如果你不知道自己想要什么,最后你会得到一大堆你不知道的东西。
——恰克·帕拉尼克
评判一个人的标准在于他能提出怎样的问题,而不是他能给出怎样的答案。
——伏尔泰
在没有任何证据的情况下是不能进行推理的。那样的话,一个人很有可能会扭曲事实。
——夏洛克·福尔摩斯
4) 阅读量不够
Jojen说过,读书人在临终之前已经领略了千种人生,而不阅读的人只有一种。
——乔治·雷蒙德·理查德·马丁
正是你读过的那些并不是非读不可的东西决定了你将会是怎样的人。
——奥斯卡·王尔德
5) 简化不当
凡事应简洁,但不可过于简单。
——阿尔伯特·爱因斯坦
至繁归于至简。
——达·芬奇
人类历史即每个人展示自己的短处的历史。
——亚伯拉罕·马斯洛
6)不擅安利自己
数据科学家要确保他们的工作与公司的业务是一个整体。这就需要一些“安利”的技巧了。如果一个人相信他的研究成果是有价值的,那么他就一定要好好推销自己的成果并努力展现出它的价值。
推销是没有止境的,它一直贯穿于我们的生活中。我们每个人都是推销员。
——詹姆斯·卡什·帕尼
我是艺术家。而且唯有将我的作品公之于众的时候我才能被称为是艺术家。艺术就是在那时产生的。
——瑞斯·伊凡斯
后记
“来吧,华生,快来!”福尔摩斯喊道,“游戏开始了。无需多言,快来!”
——夏洛克·福尔摩斯
翻译:Xinyang