大部分数据科学课程没有教给你的内容

大部分数据科学课程没有教给你的内容

虽说世界上没有完美的数据科学课程,但你知道大多数课程没有教给你是什么吗?如果你想了解更多关于数据科学的相关内容,可以阅读以下这些文章:
数据科学面试中你应该知道的10个高级SQL概念
数据科学家/分析师应该避免的5大编程错误
数据科学算法如何将商业计划变现?
Ins 数据科学、机器学习及AI宝藏博主推荐

是你在工作中需要的但又不那么明显的技能和工具!

大多数数据科学课程都可以很好地帮助你开始学习编程语言,并刷新你已有的数学和统计知识,但它们缺乏几个专门针对你在工作中所需技能的模块,这些技能将帮助你与其他数据科学家一起高效地工作,并让非数据科学家也可以理解你的工作。

以下是你可能在数据科学课程中没有学到的三件事。

软件工程实践

作为一名数据科学家,你将使用SQL、Python和R等编程语言编写代码,大多数数据科学课程会帮助你开始学习编码,但它们不会教你如何专注于良好的实践。

诸如编写干净代码、模块化代码以及如何优化代码等良好实践在软件工程中非常流行,相信我,这些好的实践将帮助你成为一个更好的数据科学家。

这里有一个简单的例子可以说明写干净的代码的意思:

# Imagine we want to write a program that categorizes a task based on its execution time
# Below are two ways of writing this code (one is more clean than the other)
# bad
t = end - start_time  # get execution time
c = category(t)  # get category of task
print(f'Task Duration: {t} seconds, Category: {c}')
# good
execution_time = end_time - start_time  # get execution time
category = categorize_task(t)  # get category of task
print(f'Task Duration: {execution_time} seconds, Category: {category}')

这是一个只有几行代码的基本示例,脚本越长,遵循这些良好实践就越重要。

如何学习良好的软件工程实践?

你可以搜索指南或教程,学习数据科学的良好软件工程实践,并阅读一本涵盖所有这些要点、并给出该主题总体概况的书。

我特别建议你去看看“Clean Code in Python”这本书,因为它涵盖了前面提到的大部分要点。

讲故事和沟通技巧

数据科学课程通常教你如何使用Python或其他工具创建可视化。他们有时甚至会提供给你一些建议去完善你的图像美观性,然而,他们并没有培养你能够有效地向他人解释见解的沟通技巧。

沟通技巧非常重要,因为数据科学家不仅与其他数据科学家合作,还与没有技术背景的受众和同事合作。如果你试图用技术词汇和行话向非数据科学家解释事情,他们很可能听不懂你说的话。相反,如果你能用通俗易懂的英语解释你的观点,大多数人都会理解你的意思。

为了更好地交流你的想法,你不仅需要良好的可视化,还需要出色的叙述,并充分利用你的数据。这就是讲故事的艺术!

图片来源于作者

如何培养良好的沟通技巧和学习讲故事?

要成为一个好的沟通者,你需要向最好的沟通者学习。如果你查阅“有史以来最好的沟通者”,你会发现像Bill Clinton、Oprah Winfrey和Ronald Reagan这样的优秀沟通者。你可以选择他们中的一个或任何其他你非常喜欢的交流者,然后观看他们的一些演示,看看是什么让他们这么优秀。

另一方面,也有学习讲故事的好书。在本文中,我将谈论一本名为《用数据讲故事:商业专业人士的数据可视化指南》(Storytelling with Data: A Data Visualization Guide for Business Professionals)的书,它将帮助你使用讲故事的力量轻松解释任何概念,并让人们参与到你的演示中来。在本文中,你还可以找到一本书,其中介绍了我最喜欢的一个沟通者的演示秘密。

协作工具

作为一名数据科学家,你将在一个大型项目的团队中工作。这意味着你将使用不同的工具与团队成员协作,使工作更高效。

你需要熟悉的工具之一是Git。

Git是一个版本控制系统,它允许我们在不破坏代码的情况下对代码进行调整和跟踪更改。有了Git,我们可以返回过去,创建新的独立分支等等,因此多个数据科学家可以一起工作,而不相互干涉。

图片来源于作者

大多数数据科学课程不教授像Git这样的版本控制系统的原因是,它们专注于培养你作为个人的数据科学技能,而不考虑你在团队中工作时可能遇到的问题。

团队用于协作的工具不胜枚举,所以你应该看看你所在的公司都使用了哪些工具,Git、GitHub和Tableau是最受欢迎的几个工具,非常值得学习。

感谢阅读,你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Frank Andrade
翻译作者:过儿
美工编辑:过儿
校对审稿:明慧
原文链接:https://medium.com/geekculture/heres-what-most-data-science-courses-don-t-teach-you-b681021a247