亚马逊资深数据科学家:如何正确打开数据科学家生涯?

亚马逊资深数据科学家:如何正确打开数据科学家生涯?

 

我们都知道,数据科学家是目前最性感的工作,目前不仅人数很少,市场需求量大,而且还有很高的薪水。因此,数据科学课程和大学课程的数量也因此正在疯狂增长。如何成为数据科学家?哪些课程是最好?应该采取什么步骤,如何以最快的方式成为数据科学家?

Karolis Urbonas

我仔细的想想了我的经历,我是如何到达这里的?我是如何成为数据科学家?我是数据科学家吗?其实我的经验算是复杂, 一开始我只是一个在一家投资公司用Excel分析的证券分析师,然后才慢慢地转向银行业,然后是咨询公司,最终做实际所谓的“数据科学”- 建设预测模型,使用大数据,编写大量的代码进行数据分析和机器学习, 在早期被称为“数据挖掘”。

当数据科学炒作已经开始时,我尝试了解它,分析它与我现在所做的不同之处,考虑是不是应该学习新技能,这样才能成为“数据科学家”。

就像大多数痴迷这个职位的人一样,报了很多相关的课程,读各种数据书籍(虽然很多并没有完成),不停地写代码,是因为我想成为那个核心人物)。但是我认为,这些大牛(“aspirin”)很少存在,即使他们真的有,但他们并不能样样精通,反倒不利。

虽然现在我也认为自己是数据科学家 – 我在亚马逊领导了一个非常有才华的数据科学团队,构建机器学习模型,使用“大数据”,我仍然认为这里面有依旧混乱,特别是对于新入行的朋友。不要误会,数据科学有很多非常复杂的分支,如AI,机器人,计算机视觉,语音识别等,这需要非常深刻的技术和数学专业知识,潜在的PhD …或两个。但是,如果您有兴趣在数年前就将数据科学角色称为业务/数据分析师,那么一下这四项规则是帮助我在数据科学领域生存下去。

      规则1 – 想好你的首要目标
首先,要对自己现有的知识储备和能力以及想要达到的目标有很公正的衡量。数据科学有很多不同的角色,重要的是要了解和评估自己当前的知识库。假设你目前在人力资源部工作,想要改变职业,那就考虑了解人力资源分析!如果是律师,那就了解了解法律行业的数据应用程序。事实是,由于各行各业都对数据有巨大的想法和渴望,大家都会想要使用它。

也就是说如果你已经有了一份工作,那么可以尝试通过使用数据来了解可以优化或解决的内容,并学习如何自行完成。这将是长期的转变,但是你仍然可以在现实世界中做一些工作并学习。如果你是学生或是刚刚离开学校的毕业生,那么你有一个完美的机会找出你热衷的并将数据与之相结合,无论是电影,也许音乐,或者汽车?这些行业雇用的数据科学家的数量都是非常之大。

      规则2 – 巩固自己的基础知识
虽然每个数据科学领域都有非常不同的要求,但基础都是一样的。基础数据分析,入门统计和编码,是最基础的。
数据分析
你需要非常熟悉这些基本的数据分析技术,什么是数据表,如何合并表,有哪些重要的数据分析技巧,模型,如何在数据集上构建摘要视图,如何从中得出初步结论,什么是探索性数据分析,哪些可视化可以帮助了解并从数据中学习。这些都是非常基本的,但相信我,掌握这些,你便能更好的在未来的工作中发展。
统计
另外,要非常了解统计。什么是平均值,中位数,要如何使用他们,什么是标准偏差,什么时候使用它没有任何意义。而当我说“基础”就是指这些基础知识。除非你是一个数学家,或是想成为一个计量经济学家,应用先进的统计和计量经济学模型来解释复杂的现象,那么就花点时间巩固自己的基本统计知识和概率。
编码
当然写代码是一定要会的。首先,要学习如何使用SQL查询数据库,数据科学团队大部分时间都花在数据提取和准备上,其中很多都是由SQL完成的。所以让你的基础知识到位,尝试建立自己的小数据库,写一些“select* from my_table”行,并且很好地掌握了SQL基础知识。然后还应再掌握一个数据分析语言,无论是R还是Python,两者在大多数职位都很有用。你并不需要不必成为一名程序员,重要的是如何使用语言来分析和可视化数据。
      规则3 – 科学的主要职责是找到并解决问题
以我多年来在工作中总结到的,数据科学家的基本要求便是提出问题,寻找问题,解决问题。想要成为问题解决者,那就要不停地提出问题。可以从身边开始,即使很,找也能从这些分析中受益。也许你会分析你的消费模式,识别你的电子邮件的模式,或只是建立漂亮的图表来跟踪你的城市的财务状况。数据科学家负责质疑一切,这个营销活动是否有效,有没有关于业务趋势,哪些产品表现不佳,需要从市场上离开,公司给的折扣真的有效果么?这些问题都是需要数据科学家验证。
      规则4 – 现在就开始,别再等啦!
这一点其实适用于任何人,任何事,任何情况。不要再停留在了解,查找资料,看那些如何成为数据科学家的书了。要开始巩固自己的基础知识,开始自己尝试写代码, 这才是正确的姿势。随着你学习的深入,要确保你开始将它应用于你热爱的领域。这就是神奇发生的地方,写你的第一行代码,看到它失败,被卡住,也许你不知道接下来要做什么,但尝试寻找答案,找到很多不同的解决方案,没有一个工作,努力建立自己的一个,终将会到达一个里程碑,那是会感谢自己的坚持。这就是学习的过程,也学习数据科学的唯一途径。举个例子,就像你想学习骑车,总不能就靠看书吧。同样的,无论学到什么,都要确保立即应用它并解决实际数据的实际问题。

李小龙在一次采访说过“ If you spend too much time thinking about athing, you’ll never get it done(如果你花太多时间思考一件事情,你永远不会完成它)。” 你必须应用你学到的东西,并确保你自己犯错误,这是你学习和改进的唯一途径。


来自:Cyborgus作者:Karolis Urbonas

原文:How to think like a data scientist to become one

谢谢阅读! 订阅我的博客www.cyborgus.com并获得最新的更新。 

也可以跟随我在社交网络:

在Facebook上跟随我的博客更新 -https://www.facebook.com/cyborguscom/
在LinkedIn上查看我 – https://www.linkedin.com/in/karolisurbonas/