
如何撬开数据科学$180K年薪的大门?
数据分析师如何转型为数据科学家?
登录LinkedIn网站
点击“编辑我的个人资料”
找到“数据分析师”这几个字,把它改成“数据科学家”
完成!是不是很简单?
然而人生怎么可能那么简单呢?培养数据洞察力是困难的。关于如何进入数据科学领域,有很多很棒的文章,但如何从数据分析师转型的文章,却不多。提到转型,有必要对这两个角色做个简单的定义。
数据分析师
收集、处理和应用统计算法来处理结构化的数据,以产生效益并改善决策制定。
数据科学家
具有类似的目标,但有实时处理大量非结构化数据的强大技能。他们在数据中发现重要的信息,清理、处理数据,并运行高级的算法,他们还具有很强的讲故事的能力和可视化数据的技能。
为什么要成为一名数据科学家?
实际上有很多原因……
影响:数据科学家有产生巨大商业利益的潜力,他们有机会在高层发表意见,帮助塑造未来的发展方向。
精通:在一个快速发展的领域,有无数棘手的问题需要用各种各样的方法来解决。例如,如何建立一个图像识别器,或者一个文本分类器来识别社交媒体上的有害评论。
相关性:一些人预测人工智能最终会取代我们的工作。一种安全的方法是创建自动化,而不是等待自己被自动化。
薪酬/机会:数据科学家薪酬和机会都相对较好。优秀的数据科学家很少,而且需求量很大。

我已经是一名数据科学家了吗?
大多数分析师都有良好的基础,但要想在复杂的结构或大型数据集上应用前沿的方法,需要多年的努力。也就是说,不需要很长时间就能开始取得成功,甚至达到超出我们预期的水平。
那么我们的工作技能有哪些?这个问题没有正确的答案,但是复杂的数据科学项目会需要多种技能。
数据科学语言:Python/R
关系型数据库: MySQL, Postgress
非关系型数据库:MongoDB
机器学习模型:e.g. Regression, Boosted Trees SVM, NNs
图像:Neo4J, GraphX
分布式计算:Hadoop, Spark
云端:GCP/AWS/Azure
API Interaction:OAuth, Rest
数据可视化和网页应用:D3, RShiny
专业领域:NLP, OCR and Computer Vision

Boosted Trees模型在数据科学竞赛中很受欢迎

RShiny dashboards可以成为交互探索数据的有效方式
获得这些技能需要很多时间,可能比你取得学位的项目时间都长。并且,即使是世界上最好的数据科学家也有很多东西要学。但是我们不应该担心自己的能力有限,如果我们每天都有所进步,日积月累,那么我们都会在未来某天达到相当高的水平。
决心和坚韧有时比我们的智商更重要。

如何制定行动计划?
在做任何其他事情之前,我们需要一些基本技能:
从正确的方法开始:十年前,为了上数据软件课程等上几个星期,很正常。但如今到处都有很棒的学习资料。我们需要持之以恒的学习,并不断磨炼技能。
学习一门语言并培养你的数学技能:从Python和R开始,Coursera和Udemy等网站提供了大量免费的培训课程。许多Python用户喜欢使用Anaconda和Jupyter Notebook,许多R用户喜欢R Studio。在理论知识方面,Andrew Ng机器学习课程和斯坦福神经网络课程都非常棒,而且非常有趣。
参加Kaggle比赛:与数千人一起解决一个具有挑战性的问题,这没有更好的方法来提高模型构建的技能了。不要担心排名,每个人都有自己的起点,试一试吧。
了解该领域的领导者:有些小组和领导者做出了非常杰出的贡献,比如杰弗里·辛顿(Geoffrey Hinton)、安德鲁·吴(Andrew Ng)、扬·勒昆(Yann LeCun)、雷切尔·托马斯(Rachel Thomas)和杰里米·霍华德(Jeremy Howard)等人。
使用有效的工作方式:打下了基础后,就开始使用版本控制系统(如GitHub)来部署和维护自己的代码,从而改进工作流程。
有效沟通:我们要能够推销我们的成果。高管们喜欢亮眼的演示,所以努力在演示中展现你的真知灼见吧。
Youtube和LinkedIn是了解行业领导、学习行业知识的有效平台

如何选择正确的环境?
即便拥有世界上所有的技能,如果没有合适的工具和环境,那么前方依旧障碍重重。总有一些因素是我们无法控制的,所以我们需要思考我们能控制什么。
加入合适的团队:这是最简单的计划,大多数中型到大型公司至少拥有一个小型数据科学团队,所以加入他们吧。
与合适的人合作:如果无法快速完成工作,那么就设法与认识的最知识渊博的数据科学家一起合作。例如,发现一个可以自动化的问题,然后与专家合作,而不是委托他们去做。
选择适当的工具和环境:公司并不确定是否投资或者如何投资数据科学工具,他们有一个繁忙的传统分析程序,安全性和审计都需要时间来开发,因此它们只会接受具有明显好处的业务。
制定明确的用例:了解你的业务以及如何应用数据科学,用一个小概念证明将这两者联系起来,以便更好地访问工具和环境。
与更渊博更有才的人合作:成为拥有高技能多样化团队的一员,你不仅收获更多,还会潜移默化的学习他们的一些知识。

总之,择日不如撞日,现在就开始你的努力之路吧。
原文作者:Ben Stanbury
翻译作者:毛毛
美工编辑:Max程猪毛
校对审稿:卡里
原文链接:https://towardsdatascience.com/from-data-analyst-to-data-scientist-f67a724ea265