这15个统计知识测验题,你能答对几个?
我在网上看到了很多争论,关于数据科学家需要知道多少数学知识。以前我是一名纯粹的数学家(现在成为了数据科学家),我站在了“需要很多数学知识”的一边。在你还不知道方法的数学基础(依据)时就胡乱应用,你可能会对它们的结果做出错误判断,这很危险。
统计学尤其如此,它是数据科学中大多数建模技术的基石。数据科学家在不了解统计模型背后的统计理论和方法的情况下就开始运行,我觉得这太可怕了。
因此,下面有一个包含15个问题的测验,可以帮助你检验你所积累的统计知识是否足够。你可以检查你的答案,最后我会检验你的表现如何。请记住,这只是为了“好玩”,我不建议将其作为正式评估或用于工作面试。请随意在评论区分享你的解题思路,或者就我所给的答案进行反驳。
如果你想了解更多关于统计相关内容,可以阅读以下这些文章:
数据科学家须知:统计学中的5个悖论
数据/商业分析师求职,如何准备统计相关面试题?
数据科学家,知道这些统计知识就对了
数据科学家八大最常见统计面试题
开始测验
- 1.填空:一个样本的标准差是该样本的______的平方根。
- 2.样本标准差公式和总体标准差公式之间有什么区别?
- 3.什么样的统计假设检验,可以应用于具有相同类别的两个分类数据样本,以确定频率分布是否显著不同?
- 4.异方差这个词是什么意思?
- 5.命名以下定理:
- 6.统计学家使用线性回归模型对因变量进行建模,而该因变量来自于Likert量表从1到5的调查评级。在这种情况下,为什么说线性回归模型是一个糟糕的回归模型选择?说明其中一个原因。
- 7.描述如何在线性回归模型中计算R平方值。
- 8.描述泊松分布和指数分布之间的关系。
- 9.当正态分布总体的标准差未知时,通常使用什么分布来估计其平均值?
- 10.填空:最大似然估计通常使用______对数似然函数的近似值。
- 11.填空:多变量模型是指涉及一个以上的______变量。
- 12.填空:任何______正态分布变量的变换也是正态分布的。
- 13.填空:______回归可以用来指定因变量的条件中值函数。
- 14.两个样本的均值差除以组合样本的标准差的通称是什么?
- 15.在典型的统计模型输出中,三个星号(***)通常代表什么?
April Fool’s Day
- 1.方差
- 2.总体标准差中的分母是总体规模。样本标准差中的分母是样本量减去1。这被称为贝塞尔校正,用以校正对总体方差估计不足的偏差。随着样本量增大,这种差异就会变得不那么重要。
- 3.卡方检验
- 4.方差不等
- 5.贝叶斯定理
- 6.以下任意一个:a)因变量是不连续的,b)因变量在量表上是有界的,c)会把序数变量解释为连续变量
- 7.计算模型的残差平方和,然后计算因变量的方差。两者相除,然后减去1。
- 8.两者都涉及一个事件随着时间推移发生的可能性。泊松分布主要处理固定时间段内发生的次数,而指数分布主要处理事件连续发生之间的时间。
- 9.t分布
- 10.二次
- 11.因(或结果/反应/目标)
- 12.线性
- 13.分位数
- 14.统计效应(或科恩效应或科恩公式)
- 15.这表明相关假设检验的p值小于0.001。
- 你得了0-3分。嗯,你真的需要在统计知识上下一些功夫了,这样你才能更好地了解建模中发生了什么。
- 你得了4-6分。你知道一些基本知识,但你可以加强学习——特别是当你做的不仅仅是简单的描述性统计时。
- 你得了7-10分。不错哦。在统计数据方面,你显然先人一步了,不过还有改进的空间。
- 你得了11-13分。非常棒,这意味着,在统计数据方面,你肯定是许多同事的得力助手。真棒!
- 你得了14-15分。完美!一定要高瞻远瞩,因为要知道你已经是一个真正的统计学专家了!
你是否喜欢这个测验?欢迎发表评论!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/
原文作者:Keith McNulty
翻译作者:高佑兮
美工编辑:过儿
校对审稿:Chuang
原文链接:https://keith-mcnulty.medium.com/fifteen-questions-to-test-your-statistics-knowledge-da4d74742abc