如何通过16周专业训练获得Data Scientist工作?

本期开课时间:

2019 年 11 月 23 日

下期开课时间:

2020 年 1 月 25 日

上课时间:

周六周日 4-6小时核心课程与实践

工作日  2-4小时老师 Office Hour 答疑

求职目标

我们的数据科学家培训课程结合当今数据应用领域的发展趋势,为学员传授最前沿的数据分析技术和工具的使用。经过多名专家级导师的认真探讨与多期项目的经验积累与调整,我们有效结合了基础知识讲授与大量的实战练习,帮助各位学员从零起步,一步步的成长为专业的数据科学家。

求职路径

课程特色

名师带你做Kaggle

为简历添彩

终身内推、修改简历

无限次一对一模拟面试

全天候、多渠道

答疑

针对应用实例

结合真实工业数据

带领学员完成

工业级数据项目

优秀学员颁发

业界认可证书

2018年3月,数据应用学院被业内杂志CIO评为 “17 best data science bootcamps for boosting your career”,作为全美唯一一家华人培训机构,与Galvanize、GA、Metis等老牌公司齐上榜!

2016年12月,数据应用学院被老牌媒体TechBeacon评为 “The top 16 data science bootcamps,并大力推荐了学院课程的特色:Research design, communicating results to non-experts, and alignment between data analysis and key business drivers。

实战项目

不同于传统的BI和软件开发, 数据行业更重视的是对大数据价值的挖掘并提供商业解决方案,因此很多公司在招聘数据科学家的时候非常注重应聘者的实践经验。针对工业界对数据科学家的要求,我们为大家提供了丰富且有价值的实战项目:

Summary:

我们导师带领大家以经典案例为基准,攻克课程进行时段中,正在进行的Kaggle比赛。 往期学员在带领下,结合自己能力,拿到了丰厚战果。除了进入Top排行榜以外,还陆续拿到了奖牌。


Kaggle竞赛是全球最大的数据建模和数据分析竞赛,也是全球范围内的数据科学家聚集与竞技的平台。数据科学家可以在该平台上参与由各大企业发布的竞赛项目,通过分析和建模来解决企业急需解决的问题。我们的学员在完成基础知识的学习后,会在我们专业导师的带领下参加经由老师认真挑选的具有较大商业价值,且当期正在进行的Kaggle竞赛项目,真正通过实际的应用来巩固所学习到的知识。

截止到目前,我们辅导的学员在Kaggle竞赛中取得了很好的成绩,多次拿到单个项目的前3%的名次,并在2016年8月取得了一枚宝贵的竞赛金牌!优秀的Kaggle竞赛过程将会成为学员的应聘时的一段宝贵经历。截至2018年初,数据应用学院的莘莘学子们已经在Kaggle比赛中获得1枚金牌,4枚银牌及11枚铜牌。 2019-2020年,又有多名学员陆续拿到奖牌,并斩获offer。

为了能够让同学能够对各个产业的数据有所了解,掌握其特定的数据风格,学院详细考量了各个产业中的不同特点和具有独特要求的产业特征,从各个产业中的数据集中精心挑选了该产业中的典型数据做成项目,让同学们拥有相应的项目经历,在之后的具体企业面试中能够有的放矢,加强针对性。在Kaggle之外,帮助我们同学在开放命题条件下对整个商业模型和数据产品研发流程有所理解。具体请参见我们的经验贴:《关于竞赛的一点思考》

Project 1: Housing Data Manipulation with Pandas (Housing Industry, Data Manipulation, Data Quality)

Project 2: Data Cleansing Practice on Housing Data (Data Wrangling, Missing Value Imputation)

Project 3: The Default of Credit Card Client Analysis (Imbalanced Dataset, Classification, Data Quality, Fraud Detection)

Project 4: Insurance Company Claims Severity (Anonymized data, Regression, Distribution)

Project 5: Data Visualization with Language Education User Datasets (Data Visualization, Data Manipulation, Python Dashboard)

Project 6: New User Bookings (Feature Engineering, Feature Extraction, Customized Evaluation Score)

Project 7: HR Predicting Attrition Rate (Exploratory Data Analysis, Model Comparison) 

Project 8: Store Item Demand Forecasting (Time Series Analysis, E-commerce, ARIMA)

Project 9: Kaggle Competition ( Capstone ) (Feature Engineering, Model Tuning, Model Ensemble)

Project 10: Online Ads EDA (Click-Through-Rate, Conversion Rate, Cost-Per-Click, Data Visualization, Seaborn)

Project 11: FinTech ( Capstone ) (Business Analysis, Feature Analysis, Feature Selection, XGBoost, Model Building)

Project 12: Ecommerce LTV (Life-Time-Value, RFM, MBG Model)

Project 13: Recommender System ( Capstone ) (Spark ALS model, Content-based, Popularity-based, Collaborative Filtering)

Project 14: Customer Churn Prediction (Data Manipulation, Data Processing, Churn Prediction)

Project 15: NLP ( Capstone ) (CountVectorizer, TFidf Vectorizer, WordEmbedding, Neural Network)

Project 16: Amazon Alexa Sentiment Analysis (Sentiment Analysis, Text Classification, RandomForest)

我们经常会通过影评来了解一个电影是否精彩,从而决定是否会走进电影院去观影。如果影评是积极评价,我们可能就会决定去看一看,如果影评是消极评价,那么我们就不会去购票。在这个项目中,我们通过使用自然语言处理技术(NLP)分析 imdb 上对于电影的评论文字,来判断评论的情感极性

收获:

– NLP处理流程的进阶学习与应用
– 多种机器学习算法的对比与评价(Logistic Regression, Support Vector Machine and Perceptron etc.)
– 网页用户交互界面设计与产品展示
– 产品实现对一段文字的情感评价与关键词提取

项目技术:

使用Naïve Bayes 实现Sentiment Analysis (CountVectorizer, TF-IDF)

使用Word embedding将文本向量化 (GloVe)

使用Deep Learning, LSTM架构结合以上技术实现Sentiment Analysis


网页交互界面举例:(学员利用学到技术,使用其他数据集实现的NLP情感分析)

通常情况下,Lending Club (美国P2P借款机构)中包含了成百上千的贷款项目,让投资人难以进行选择。在我们的FinTech项目中, 我们会使用过去所学的知识来设计一款智能投资顾问的数据产品,通过机器学习技术帮助投资人在Lending Club中鉴别项目的价值,以确定最优项目来进行投资。当新的贷款项目进入平台后,我们的产品会自动分析项目的各项指标,从而筛选出最佳的投资项目。我们还会设计简单的产品展示页面,实现产品与用户操作上的交互功能。

  • 1,320,000+条大量数据的处理和100+数据特征的筛选
  • 通过Gradient Boosted Regression Trees (GBRT) 算法构建机器学习模型
  • 网页用户交互界面设计与产品展示
  • 产品实现在Lending Club平台下对项目的评估与最佳投资项目的选择

推荐系统近几年发展十分火热,几乎所有的电子商务、社交网络、购物平台等都在不同程度上使用了推荐系统,在游戏平台中,推荐系统也是不可缺少的部分。在我们的游戏推荐系统项目中,我们基于Steam平台,对用户过去的游戏信息进行分析,根据游戏的受欢迎程度设计了推荐系统,为用户进行游戏推荐。用户同时也可以通过选择感兴趣的类别对结果进行过滤,对推荐结果进行进一步优化。学员将从产品定义、数据爬取、数据导入、数据分析、推荐系统平台设计、效果评估等方面,完成一系列完整的高水准产品研发过程。

  • Steam游戏平台的数据抓取
  • 300+的特征处理与筛选
  • 基于Popularity-Based, Content-Based 等多种推荐算法实现对用户的游戏推荐功能
  • 网页用户交互界面设计与产品展示

师资背景

学生就业 导师

资深全栈数据科学家,数据科学协会(joinideas.org)执行主席

南加州大学(USC)客座讲师

大数据安全、数据科学教育专家

数据结构和算法 导师

现任Bank of America工程VP

University of Texas 计算机博士

数据处理及机器学习 导师

现任FLAG资深数据科学家

Duke University 物理博士

数处理、A/B Testing 导师

现任Ebay数据科学家

University of California at Riverside 化工博士

机器学习数学原理 导师

现任数据科学Research Professsor

环境科学博士

统计学 导师

Microsoft数据科学家

Purdue University 统计学博士

金融工业背景知识 导师

现任Discover数据科学家

Purdue University 化工博士

数据预处理 导师

现任CapitalOne数据分析部经理

资深数据科学家

面试辅导与内推

学员拿到onsite面试将有机会直接对话学院面试辅导老师,获得针对面试和个人职业发展的相关辅导

专业就业指导老师为学员进行一对一简历修改

完成课程后,导师将会根据学生的背景,辅助学员制定求职计划

学员将能以最优惠的价格参与学院的职业辅导课程,我们career coaching课程包括面试技巧辅导 + 真题模拟面试

学院将为优秀学员提供数据行业各大公司岗位内推机会

部分职业辅导导师:

额外收获

解决自学窘境:通过系统的学习,我们能让您用最快的速度入门数据科学领域,并且在您遇到问题的时候第一时间提供帮助,让您不会出现自学时举步维艰的窘境。

顶级职业Networking:目前我们数据应用学院的导师和校友遍布北美各大数据公司。他们组成的强大后援团会为大家提供第一手的工作经验、面试经历以及职位内推信息。

任劳任怨的TA团队:课下TA全程辅导,答疑解惑,手把手的带您入门。学员可以通过Discussion Board随时提出问题寻求即时的解答。加入数据应用学院,学习上不会再有跨不过去的坎儿。

报名要求

学历背景方面:我们对学员的学历和专业没有特别的要求。我们学院的学员背景多样,学历涵盖了BS,Master与Ph.D.,专业包括了EE、 统计、数学、物理、机械、化工、环境工程、运筹、金融、石油等等。

知识储备要求:Data Scientist 全周期项目对报名学员有些基本prerequisites。为了能够跟上我们的课程进度,学员需在报名前掌握:Python、 Machine Learning、 Statistics以及SQL等方面基础知识。

报名流程

常规流程:  点击右边”报名申请” 按钮, 填写报名表 ->  我们课业辅导老师会尽快联络您解答疑惑 -> 支付学费完成报名 -> 助教联络准备开课

快捷流程: 如果您已经对本课程非常熟悉了解了, 可以在本页面提交”报名申请“后, 直接在线付款 -> 联络准备开课

付款方式

我们支持多种线下付款方式和渠道,包括但不限于信用卡付款、Paypal付款、Chase quickpay等。可以电话或者邮件联络我们获取具体方式。联系邮箱:info@dataapplab.com,联系电话:1-800-485-7918

常见问题

如果我临时有课错过课程怎么办?

不用担心!我们所有Lecture都是Live课程,同时提供错过课程的同学录像,方便同学们预习巩固

我是零基础,可以来上这门课吗?

我们准备了丰富的Python、SQL、R等technical基础课视频给同学们课前热身,具体情况请联系我们老师

远程上课如何保证质量呢?我有问题的时候可以找谁呀?

除了上课时间在线上向导师提问之外,我们的课程每周都有实时线上助教语音答疑、Discussion Board答疑,保证同学们任何时候有问题都可以得到解答

 

 

 

 

 

联系我们微信

扫二维码或搜索 ID:dataapplab_wechat