如何系统有效的规划数据科学自学之路?

如何系统有效的规划数据科学自学之路?

在收到来自学术合作伙伴的多次要求后,我们冒险提出一项课程规划图。 作为一个团队,尽管我们中的许多人为了一种或多种学术能力花费了些时间,但我们实际上大部分时间花费在了业界。 接下来是一系列广泛的建议,并且不可避免地需要对每个个例进行大量调整。 鉴于此,这里是我们的课程规划。

我们首先要强调,以应用为中心的学习是使学生在为行业环境中应用其知识做好准备的最重要因素。用现实存在的数据来回答现实的问题是他们最好的准备方式。以动手实践为基础,并同时教授数据机制和数据直觉,独立同时完成这几项是不可能的。在此基础上,我们提出了一系列主题,为实践数据科学做好了准备。

数据科学及以数据为中心的学术计划的类型与我们在工作中确定的主要技能领域密切相关。有强调工程的程序,强调分析的程序和强调建模的程序。 两者之间的区别是,分析着重于我们可以从数据中学到哪些问题,建模着重于估计我们希望拥有的数据,而工程着重于如何使它们更快,更高效,更稳健地运行。

也有某种程度上涵盖所有这些领域的通用数据科学计划 。 此外,还有很多领域特定的程序 ,教授给特定领域特定的工程、分析和建模技能的子集。

这些计划原型中的每一个课程建议都或多或少有所不同。 但他们所共享的是一些核心的主题。 接下来,以分析、工程和建模为中心的程序将会拥有自己的一片天。 一般课程将包括分析、工程和建模课程的某些方面,尽管课程的深度可能不尽相同。学生通常会以这三个领域的任意组合中选择课程进行学习。

除了主题甚至有的时候整个课程侧重于该领域共有的特定技能,特定领域课程的课程看起来与普通课程十分相似。 例如,以精算为重点的数据分析程序可能会包括保险公司中最常用的软件工具,时间序列和罕见事件预测算法,以及整个保险业都可接受的可视化方法。通过基于特定领域的实际数据的项目,学生可以最佳地练习他们的技能。 强烈建议实操项目或实习。在设计课程时,各种机构也可以考虑提供跨学科的学位及课程。 特定领域的计划通常会结合来自多个部门或学院的课程。

这是我们建议在每个领域中包括的主要主题,并列举了一些特别重要的子主题。

请注意,对于每个主题和子主题,都会有许多有效的方法将其分为课程。 对于机构而言,最好的方法取决于许多因素,包括学期的长短,每堂课的小时数,现有部门的界限,教师的可用性以及学生吸收信息的速度。 这些建议假定了一个为期两年的硕士课程计划,其主要目标是为让学生做好就业以及持续职业发展的准备,尽可能肯定地将其扩大或缩小以适应其他计划的范围。

值得重复的是,以应用程序为中心的教学将为学生提供最佳的专业职位准备。 在具体的实例中巩固基础理论,在解决更大的问题的背景下锻炼更多具体的技能,学生便会对其工作原理以及在何处应用的理解更加深刻。

原文作者:Brandon Rohrer

翻译作者:Tony老师

美工编辑:过儿

校对审稿:Dongdong

原文链接:https://www.kdnuggets.com/2019/12/data-science-curriculum-roadmap.html