2023年,你可以做10件简单的事情来提高你的数据科学技能

2023年,你可以做10件简单的事情来提高你的数据科学技能

啊,新的一年!

成长、发展和进步的机会。一个重新开始的机会——放下2022年的困难,培养光明、成功的12个月。

如果你是一名数据科学家,你将有机会在这个不断增长和具有影响力的领域继续发展你的技能,努力为世界做善事。还有什么比这更好的决议吗?如果你想了解更多关于数据科学的相关内容,可以阅读以下这些文章:
打好数据科学和机器学习的基础——6本书带你学数学
数据科学家或将成为历史?——无代码数据科学的诞生
每个数据科学家都必须遵循的技巧
数据科学面试中的机器学习问题类型以及如何准备这些问题?

请允许我在你的路上帮助你——你必须做的10件事,让你的2023年数据科学领域达到一个全新的水平。

1.注册一个在线课程

数据科学是一个不断变化的领域。因此,你需要在该领域中保持巅峰状态。我仍然听到有人坚持认为没有必要学习Pandas,因为R已经足够了。或者说数据科学家真正需要的唯一语言是SQL。

当然,可能有一些数据科学的工作在SQL,甚至R中蓬勃发展,但这不是重点。如果你不愿意跟上并学习最新的技术,那么你很快就会被这个不等人的行业中落后。

因此,请注册一个在线课程,通过一个详细的YouTube教程,在Kaggle上学习一项新技术并做一些事情。

你会因此变得更好。

2.致力于学习一项特定的新技能

这与上述观点有关,但又不完全相同。在之前的一篇文章中,我讨论了让你成为下一个级别的数据科学家的各种不被重视的技能(https://medium.com/towards-data-science/3-underappreciated-skills-to-make-you-a-next-level-data-scientist-6b5236770651)。如果我建议的东西都不适合你,你可以在网上找到大量类似的文章。

扩展你的技能有两个好处:

  1. 你将成为一个更多样化的数据科学家。
  2. 你将成为一个更独特的数据科学家。

这两种优势将导致一个平衡:公司会需要你,而且他们会非常需要你。

3.教导某人,任何人,机器学习不是魔法

去年,我参与了一个涉及预测性机器学习模型的数据科学项目。我只是在最初阶段加入的,然后把它交给了另一个追求更光明前景的人(正如你在本文中了解到的,我对机器学习持轻微的怀疑态度)

几个月后,接替我的同事表示很沮丧。为什么?因为项目团队中的其他人员——即那些负责项目管理、领域专业知识等,对数据科学知识有限的人——不断地催促我的同事开发一个机器学习模型,而他们甚至还没有访问数据的权限。他们坚持认为这是可能的。

这听起来很夸张,但却是事实。我也不责怪其他人。由于即将到来的自动驾驶汽车和虚拟家庭助手(我在看你,Alexa)等技术的强大功能,越来越多的人开始将机器学习视为某种神奇的黑盒子,它可以做任何事情。

我并不是想戳破你的幻想,但机器学习只是一堆电子表格和复杂的数学方程式。它很强大,但它只能和数据一样好,如果你的数据不合格,它可能会导致一些相当可怕的结果(想想歧视性的面部识别算法或撞人的自动驾驶汽车)。

更多的人需要知道这一点。作为一名数据科学家帮助传播信息。

4.如果你不了解Pandas,学习它

如果你这样做,那就学点新东西吧。(https://pandas.pydata.org/docs/user_guide/index.html#user-guide)

Pandas是目前用于数据处理、操作和分析的最强大的工具之一。它是如此的完善,以至于更多的专业的模块被设计用来与其主要的数据存储方法DataFrame一起工作:

  • 用于机器学习的Scikit-learn
  • 用于可视化的Altair
  • 用于科学计算的SciPy

开发人员和研究人员也一直在开发构建在Pandas之上的工具,使其变得更好。这里有一个最近的例子:https://ponder.io/

如果你是一名数据科学家,学习Pandas。拜托。

不要让我明年再告诉你。

5.学习一些关于定性研究的知识

我与一位研究处于数据科学前沿的人密切合作。他正在努力建立更加公平和准确的社交推荐系统(如果你不知道那是什么,一个例子是在你的Instagram的发现页面上为你推荐东西的算法)

他的工作已经在一些顶级会议上发表,而且他正在努力从一个顶级机构获得博士学位。他也是一个很好的人,如果你有关于数据科学的问题可以去找他。

爱发牢骚的人吗?他几乎从不编写代码或进行定量测试。当然,他的一些项目涉及这些更多的技术元素,但它们不是他的专业领域,也不是项目的主要重点。

他是一个彻头彻尾的定性研究人员,他将自己在技术领域的知识(他上辈子是一名程序员)和最先进的定性研究技术结合起来,从社交媒体数据中了解到一些非常酷的东西。

所以,如果你过于执着于你的代码和数字(就像我自己一样),考虑学习一些定性研究的知识。

好的数据科学需要两者兼备。

6.学习设计用户研究

越来越多的人开始意识到对技术的盲目信任可能是愚蠢和危险的。因此,好的数据科学正变得更加以人为本。我的一个同事现在是一名数据科学家,她直接从同一家公司的用户体验工作中毕业后进入这个岗位的。

无论你是在设计一个新的模型、算法还是可视化,都必须对其进行测试,以确定其实际可用性并确保适当的道德规范。然而,进行适当、严格的用户研究可不是在公园里散步那么简单。它包括精心的设计,统计学的工作知识以及将所学知识付诸实践的能力。

这是我自己所缺乏的技能;我将在2023年初参加这方面的课程,以填补空白。

7.做一个个人项目

当我还在上大学的时候,在实习申请季节有很多关于在简历上突出什么是最好的品质的讨论。

一些(不太值得信任的)学生坚持认为GPA应该用粗体字写出来。其他(更聪明的)建议把重点放在你以前的经验和课程上。

但是那些真正知道自己在做什么的学生——那些曾经经历过整个过程的年长学生——给出了最宝贵的建议:假设你申请的是一个基于行业的技术职位,项目应该是你简历上最突出的部分之一。

雇主更关心的是你能做什么,而不是你在哪里工作过或你的学位是什么。即使是在阅读你的经验时,他们真正想要的也是你在那些工作上取得成就的细节。

建立一个个人项目不仅会为你的简历加分,还会帮助你磨练数据科学技能。

这是一个双赢的局面。

8.拓展你的数据科学视野

由于我偏爱可视化的数据科学子领域,所以我将在这里使用它作为示例。把这个例子看作是所有数据科学的一个缩影。

当大多数人听到“数据可视化”这个词时,他们会想到折线图或柱状图,如果他们有冒险精神,甚至可能会想到直方图。从这个角度来看,世界上最早的数据可视化是在15世纪和16世纪左右发展起来的,那时这种图表开始出现。

这是一个非常有限的观点。数据可视化的意义是什么?它的目的是获取一些难以解释的形式的数据——无论是数字、文本还是其他形式,并以易于理解的可视化方式表示它。它可以是任何获取此类数据并对其应用可视化转换的东西。

看看下面的Imago Mundi,这是一张来自巴比伦帝国的地图,估计是2500年前雕刻的【1】。

图片来自Creative Commons

这是一种将复杂的地理空间数据以一种普通人更容易理解的方式表示出来的可视化方法。对巴比伦人来说,它的价值不亚于我们今天在新闻上看到的地图,承认这一点为扩大我们自己对今天可能产生的视觉化的看法提供了基础。

不要拘泥于“数据科学”的教科书定义。成功的数据科学需要想象力和聪明才智。

拓宽你的视野。

9.写一篇文章

我承认在这一点上有点偏颇,但我要借此机会说清楚这一点。

我教授计算机科学和数据科学入门多年,我很幸运地与该领域的一些专家进行了交流。具体来说,就是技术教育方面的专家。

尽管个人喜好和观点千差万别,但我交谈过的每个人都有一个共同的信念:学习东西的最好方法之一就是教授它。

每次我写一篇关于技术数据科学主题的文章时,我都比以前有了更深刻的理解,这就是写作的本质。被迫清晰地表达一个概念需要我深刻地理解它。最重要的是,出于对误导他人的恐惧,我经常会先研究这个主题,并使用各种资源复习它,进一步增加我自己的学习。

它是否经常耗费时间并令人生畏?是的。但这很值得吗?绝对的。

试一试吧——你永远不知道你可能会学到什么。

10.最后,休息一下

科技行业的工作强度是出了名的。我的朋友是Amazon的软件工程师,他们经常向我描述人们是如何过度工作的。Elon Musk在收购Twitter后公开表示,任何留下来的人都必须愿意在极其苛刻的条件下工作。

我们很容易陷入一种专注于工作和改善自己的模式,同时忘记了生活的真正意义。你想通过数据科学让世界变得更美好,对吗?那么就从你自己开始吧。如果你工作过度,你会变得刻薄——对每个人、每件事。当这种情况发生时,你将很难记得自己当初为什么要开始。

相信我,我也经历过。这是一个最好不要看到的地方。

所以对自己好一点,深呼吸一下,也许在一个美好的热带假期后,你会担心这些数据集。

总结+最后的思考

以下是你的2023年数据科学备忘单:

  1. 参加一个在线课程。
  2. 学习一项新的特定技能。
  3. 宣传机器学习不是魔法。
  4. 拜托,为了对这个世界上所有美好事物的热爱,学习Pandas。
  5. 学习一些定性研究的知识。
  6. 研究用户研究的强大潜力。
  7. 开始做一个个人项目。
  8. 拓宽你的数据科学视野。
  9. 写点东西并发布在某个地方!
  10. 呼吸、放松、休息一段时间。

为一个精彩的、有道德的、有数据的新年干杯。你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

引用

[1]https://www.smithsonianmag.com/travel/where-see-some-worlds-oldest-maps-180963855/

原文作者:Murtaza Ali
翻译作者:马薏菲
美工编辑:过儿
校对审稿:Chuang
原文链接:https://towardsdatascience.com/10-simple-things-you-can-do-to-improve-your-data-science-skills-in-2023-af274dc513da