写给每一个想读数据专业的你

写给每一个想读数据专业的你

身边很多朋友提过或者是想要走进大数据这个行业

每个人的Background不一样,能力,擅长的领域都不一样

有一句发自肺腑的话要说给大家听

不是热门的,薪水高的,所谓好找工作的专业就值得去学;

真正值得学的是你理性地衡量了所有标准以后,最适合自己的,才是值得你学的

首先,先来看看一篇很优秀的文章里的几句话

这篇文章叫做:在你想要读数据科学的学位前,你需要知道的五件事


你不一定非得读一个数据的学位;你可以自学,或者去一个boot camp。

不讲笑:此刻你可能需要一个网站

www.dataapplab.com

 

数据科学从来就不仅仅是数据,它牵扯了无数个不同的领域。

 

如果有一个专业或者项目提供的课程只是简单地把各种别的相关课程包装一下,别去。

 

理论之上还有不同的理论要去学习,好好掌握基本的理论

 

无论你读不读一个学位,你都要稳步提升自己的软实力。


理性,合理,不违背真心地衡量自己是你做出人生重大决定的第一要义。

让我们来举一个可爱的?

布吉岛大家还记不记得当年火遍全球的

Pokemon GO!

如果你是一只Pidgey,那你就特别特别努力地进化自己,然后变成一只Pidgeotto,然后再继续努力,变成一只厉害的Pidgeot。你可以做你擅长的领域的大牛,或者你可以做你擅长的领域的数据师,毕竟数据从来都不仅仅是数据。

如果你是一只Eevee,那你可以努力看看,看看自己会变成哪种小精灵。是数据科学家,商业分析师,还是数据工程师?

如果你是一只 Jigglypuff,Clefairy 或者 stop-ed-info.com

请乖乖做一只小可爱好么?

当然你也可以是会数据分析的小可爱。

如果你是一只Magikarp,请认识到自己的潜力,你,就是下一个吴恩达

好啦❤️ 让我们回到正文

【本科篇】

本科的专业相比于研究生,可能课程更具多样性。和别的专业的学生一样,都要修一些General Education,不同领域各种门类的普遍性教育课。然后专业课的部分更多的是对于基础性教育课一层一层的积累,所以相比于研究生再转进去读的同学来说,本科开始读可能基础会更扎实一些。然而,本科的数据专业并不多,而且都很新,加上正规的不正规的,大概齐是有六十个左右的学校开设了本科的数据科学专业。

我从中选择了4个项目来跟大家分享。

【Columbia University —  B.A in Data Science】

一个综合排名贼高的藤校,本科设立了一个数据科学的专业,计算机院的专业。

官网上稳准狠地说明了Data Science的本质,不过就是学好了计算机和统计。

从官网的课程设置来看,还是对于学生的计算机和统计功底要求都很高。这对于一部分还没有决定是不是要走数据科学走到黑的人来说是好的,研究生可以重新回到计算机科学的回报或者去做个统计学大牛也不是不可以。

核心课程

❤️

Probability Theory

概率论

Statistical Inference

统计推断

Linear Regression Models

线性回归模型

Statistical Machine Learning

统计机器学习

Introduction to Computer Science

计算机科学

Data Structures

数据架构

Discrete Math

离散数学

Analysis of Algorithms

算法分析

看了这些,你是不是有一丢心动?

我告诉你:请安抚好你的小心心别乱动,哥大不是你想考想考就能考。

【University of Rochester – B.A / B.S in Data Science】

这个大学是厉害的,同一个专业,你可以选择以BA毕业也可以选择以BS毕业,你要是想以BS毕业,你就得多读几节课。官网里说了,BA呢更自由一些,一般是你想要双专业毕业的话会更合适一些。如果你想深度了解数据,那就选择BS的课程。

对于这个专业设置,我觉得是厉害的,

核心课程

❤️

Discrete Mathematics

离散数学

The Science of Programming

编程

The Science of Data Structures

数据架构

Linear Algebra with Differential Equations

线性方程

Ordinary Differential Equations

常微分方程

Computational Introduction to Statistics

计算机统计

Elements of Probability and Mathematical Statistics

概率论与数理统计

Applied Statistics for the Biological and Physical Sciences

生物与物理统计

Intermediate Statistical and Computational Methods

中级统计与计算机方法

如果大家有幸被录取到了这所美丽的学校,可以考虑跳进数据科学的大坑。

【Ohio State University – B.S Data Analytics】

曾经年幼无知的以为OSU只有商学院厉害,后来我有朋友去OSU读了Data Analytics,才发现,咦,技术也是挺厉害的。介绍它的原因呢是因为它这个专业下有几个很有趣的分支,我觉得作为本科的专业,这一点是比较难得的。因为相比于别的传统专业,数据科学已经是非常细化的专业了,能够分出一定的师资在专业下开设分支以便学生学习不同领域的数据是难得的。

核心课程也没有什么可惊喜的 所有学校都大同小异

❤️

Calculus and linear algebra

微积分和线性代数

Data mining and statistical learning

数据挖掘和统计

Database design and cloud computing

数据库设计和云计算

Optimization (这个课是有一丢厉害的,一般研究生的program里才会出现)

最优化

Probability and statistical inference

概率与统计推断

Regression modeling and statistical decision making

线性回归和统计决策

Software design and programming

软件编程

Visualization (这个课也是有一丢重要和厉害的)

可视化

每个学生从下面四个里面选择一个方向专攻,看上去都是厉害的不得了的方向

但基于我作为一个本科生 对 本科生群体的了解

选的最多的应该还是Business Analytics 和 Computational Analytics

Biomedical informatics

生物信息学

Business analytics

商业分析

Computational analytics

计算机分析

Social science analytics

社会科学分析

【University of California, Irvine – B.S Data Science】

最重视的当然要放在最后,这是我的母校,DS也是我当年心心念念的专业。这个专业比较新开设的较晚,它出现的时候我已经没有机会转进去了。

 

好的让我们来看看这个专业的

核心课程

❤️

Introduction to Programming

编程

Programming with Software Libraries

进阶的编程

Intermediate Programming

最厉害的编程

Introduction to Writing and Rhetoric

写作和修辞学

Critical Reading and Rhetoric

批判性阅读和修辞

Seminar in Data Science

数据科学研讨会

Calculus

微积分

Statistics

各种统计课

Machine Learning and Data-Mining

机器学习 & 数据挖掘

Design and Analysis of Algorithms

算法的艺术

Information Visualization

信息可视化

UCI 最引以为豪的writing program也是特色之一,在我司之前做的各高校数据项目分析里,Communication and Story Telling也是极其重要的一点,所以UCI在这件事情上是完胜的。其他的呢,公正地说其实和各个program的差距不大,都是以编程和统计为主,然后上一些高阶的计算机课。但Irvine真的是个太好的地方,如果你还在纠结要去哪里读数据科学,Welcome to Irvine!

【研究生篇】

研究生的数据科学Program可就是百花齐放了,要是选起来我能选一天一夜,所以我先简要地给大家介绍几个厉害出名的Program,然后再说几个比较常见的项目,让大家能够对研究生项目的有所了解。

首当其冲地,让我列出一溜全美最6的数据类研究生项目,

# 排名不分先后,这只是我看了一堆文章以后罗列出来的,没有学校塞钱给我好么?

Carnegie Mellon University
江湖人称:卡耐基梅隆 | CMUMaster in Computational Data Science
Massachusetts Institute of Technology
江湖人称:麻省理工 | MITMaster in Business Analytics
New York University
江湖人称:纽大 | NYUMaster in Data Science
Stanford University
江湖人称:斯坦福 | SUMaster in Statistics, Data Science
Columbia University
江湖人称:哥大 | CUMaster in Data Science
Northwestern University
江湖人称:西北大学 | NUMaster in Analytics
University of California, Berkeley
江湖人称:伯克利 | UCBMaster in Information and Data Science (Online)
Georgia Institute of Technology
江湖人称:乔治亚理工 | GITMaster in Analytics
University of Southern California
江湖人称:南加大 | USCMaster in Business Analytics
George Washington University
江湖人称:乔治城大学 | GWUMaster in Data Science
Michigan State University
江湖人称:密歇根州立 | MSUMaster in Business Analytics

这些项目各有好坏,各有千秋,

我没有再一个一个给大家罗列课程了

原因是

但是我会告诉你如何分辨一个program的好坏,

部分idea窃取自Aarshay Jain写的一篇博客

Program Name

从小我们就知道不能通过看一本书的皮来决定这本书值不值看,

虽然现如今这个道理行不通,颜值是第一要义,

不好看的东西我一眼都不会看,

不过… …

数据是颜色不一样的烟火

没有什么比Program本身更重要了,名字都是骗人的!

Curriculum

课程设置绝对是看一个项目好不好最重要的东西了。课程是告诉你你可以学到什么并且能告诉你这个program和你想要的东西差距有多远的第一衡量标准。通常,一个Program的课程会分为核心课程和选修课程,你可以来回瞅瞅看,哪些才是你最想要的。

课程是不是自由多变,

有没有给你足够的空间让你去选择适合你的计划,

Tip:

对于研究生项目还有一个重要的事情就是对部分课程的减免问题,因为每个学生背景不一样,所以学校也会多多少少地对一些基础比较好的同学免去一些他在本科学过的课。

但我告诉你,你一定要去跟学长学姐们问清楚哪些课难哪些课简单,

有的课按照条例虽然你可以被免掉,但是如果它很难你也要注意,尽量还是修一下,

有的课很没有意义,你就尽量能免则免。

Practical Training Opportunities

这个就是工作实践的机会,不知道是马克思还是恩格斯,大概是马克思?说过“实践出真知”。觉得自己学了一肚子才华,不用一用,你还真以为自己都学会了。

所以,有无实践机会是very very重要的。

实践机会可以是实习,阶段性Project (Capstone Project), Hackathon都可以。

同时地理位置也是非常重要的。

举个栗子?(一个已经被用烂的?):

Google 每年 招的 最多的三所学校的学生分别来自

UC Berkeley, Stanford 和 San Jose State University!!!!

惊不惊喜?意不意外?

就是想让你知道地理位置对于实践出真知贼重要

Industry Collaboration

这一点其实就是在说这个program有用的产业界的支持合作有多少。因为如果一个大学一直照着课本上的东西去教,就一定会被淘汰,但是如果有各种产业界大牛或者在这个行业里公司经常性地给予这个program或多或少的支持,这个program所教的东西就不会与时代脱轨。

Research Opportunity

有没有做研究的机会也很重要。如果你是一个研究性人才,想要继续读博士或者深层次的数据架构,那你一定要看看这个program有没有给你做研究的机会。

Class Profile

这个是什么意思呢?

?意思就是?

如果你无法看清自己是个什么水平的学生,

你自己心里对自己没点儿B数的话,

那看看你的同班同学吧!

看看他们都是什么人,毕竟你们是被同一个program招进来的,你们不会差的太远。

如果你的学校没有把你的同班同学信息share给你,

那你可以借助facebook和linkedin来寻找信息。

University Reputation (Ranking)

排名这个东西,我们都是最在乎的,蛤蛤,就算你谴责了我们这么多次太在乎排名,我们还是在乎。因为如果我考上了哈佛,就是比你考上180多名的野鸡大学牛逼的对么?

说笑啦!

排名这个东西呢,somehow在data science这个学科还是非常关键的,因为这个专业非常的新,所以我们没有办法去观察往年的历史来看看到底这个学校被聘用率如何,所以排名是需要被纳入衡量标准的。

Return on Investment

这个我觉得这篇文章的原作者说的是非常有道理的。就是你得看你的投入产出比。

通常数据科学的项目是不会给奖学金的,并且学费相对较高,所以你要做的就是去比较差不多的行业里的专业的program的学费,数据科学你就去比比计算机统计,看看差的多不多。如果差的很多,那有可能学校看着一个厉害的新项目,想要给从你身上榨点钱。

但是,辩证的来看,如果你觉得这个学校的项目,基于我们说的各种衡量标准来看,非常好。那这个投入产出比是值得的,你花了很多钱,受了最牛逼的人给你的最好的教育,然后你拿到了很好的工作,这个就是值得的。

First Hand Experience

说了这么多都比不上你自己去试一试。去看看网站,看看细节,看看第一次见面有没有缘分。问一问以前的学姐学长,看看他们喜不喜欢这个program。

感受,体验,经历比什么都重要。