Live 线上讲座
数据科学读书会 Book 17 – 因果推断
因果推断的公式和模型
数据应用学院(Data Application Lab)专注于数据科学,人工智能和大数据的职业教育, 每年向全球各地,包括硅谷和华尔街的知名企业输送数百 Data Scientists, 更有大量的 Data Analysts,Business Analysts,Machine Learning Engineers,Software Engineers 以及 Data Engineers。多年的钻研积累和专一打造了独一无二教学方法和求职经验。被多家北美英文科技媒体列为 Top 10 North American Data Bootcamp。学员遍布美国加拿大,还有来自欧洲, 澳洲和亚太等地的慕名者报名参加。
因果推断是数据科学中的一个重要组成部分。我们需要通过适当的实验设计或者观察性研究来做出推断,并以此为依据,判断目标与关键结果(OKR)是由什么驱动的。在本系列讲座中,我们将以《Causal Inference: What If 》(Miguel A. Hernán, James M. Robins)一书为参考,带你了解因果推断这项复杂的科学任务。
本书作者Miguel Hernán和Jamie Robins是哈佛大学公卫学院教授,在因果推断领域做出了突出贡献。本书于2021年出版,是因果推断领域比较实用的一本书籍。本书分3部分,22章, 阐述了常用的因果推断方法和一些实际应用。本期读书会只选取前18章的内容讲解,在最后还会加入一节关于采用机器学习方法进行因果推断的最新研究。本次课程从第一讲起由简入难,可能会涉及一些数学,统计和经济学知识,领读人会尽量采用平实的语言进行直观讲解,但是仍然可能有些部分无法跳跃,希望大家尽量跟读学习。
在整体7次的直播课上,你将会了解因果推断相关概念和方法,包括因果推断基本概念和构架,逆概率加权 (IP weighting),倾向性评分(Propensity score),工具变量(Instrumental Variable),采用机器学习进行因果推断等知识点;再通过实际案例来了解如何应用模型与非模型的方法应用因果推断。
1.因果效应(Causal Effect)
因果效应(Causal Effect)的定义
随机实验
观察性研究
2.因果效应的修饰和交互
效应修饰 (Effect modification)
交互作用 (Interaction)
因果效应的图像表示
3.因果推断的干扰和偏差
干扰因子 (Confounding)
选择偏差 (Selection bias)
测量偏差 (Measurement bias)
4.因果推断的模型和随机性
随机变异性 (Random variability)
为什么要使用模型
逆概率加权 (IP weighting)和边缘结构模型(marginal structure equation)
5.因果推断的公式和模型
标准化和参数-G公式
G-估算和结构嵌入模型
结局回归(Outcome regression)和倾向性评分 (propensity scores)
6.因果推断的生存分析和变量
工具变量 (Instrumental variables)
因果推断中的生存分析
因果推断中的变量选择
7.使用机器学习进行因果推断
元学习器 (Meta-learner)
因果推断树
价值优化方法 (Value optimization methods)
2022年3月5日 “商业分析师” 开营啦!https://www.dataapplab.com/ba/
数据应用学院 — 北美留学生求职的最佳路径 www.dataapplab.com