数据分析的四种类型

数据分析的四种类型

聚焦数据科学领域,数据分析四大类别:

描述性数据分析、

诊断性数据分析、

预测性数据分析、

指导性数据分析。

 

四类数据分析操作难度与产出价值关系图

 我们曾在过去的博文中介绍过数据分析的一些基本原理和常见误区。这次我们将在本文中着重探讨我们在数据科学领域中遇到的四种数据分析类型:描述性数据分析,诊断性数据分析,预测性数据分析和指导性数据分析。

 

与初入数据分析领域的年轻分析师交谈时,我常问他们在他们看来数据科学家最重要的技能是什么,对此他们众说纷纭。

 

而我的观点是,他们最重要的技能将是把数据转化成对于非数据专业人士来说清晰且易理解的信息的能力。瑞典统计学家汉斯·罗斯林(Hans Rosling)就因此而闻名。

这却是一个经常被忽视的技能。

下面 “TedTalk” 视频中,汉斯·罗斯林(Hans Rosling)对此给以了一些阐释:


Youtube 用户可以搜索:The best STATS you’ve ever seen

谈到这个话题,就很有必要介绍一些帮助人们了解数据分析在促生有价值见解中的作用的工具。这样的工具之一就是四维度的分析类别。

简单来说,分析可以分为四个主要类别。对此我将在下面进一步详细解释。

 

1. Descriptive: What is happening?

1.描述性分析:描述发生什么

 

这是众多分析类型中最常见的形式。从商业角度来说,它为分析人员提供了业务中关键指标和措施的概况。

比如每月的损益表。又比如说,分析师可以获得大量客户相关的数据。了解客户相关人口统计信息(例如,30%客户是个体经营者)即可归类为“描述性分析”。利用有效的可视化工具可以强化描述性分析所传达的信息。

 

2. Diagnostic: Why is it happening?

诊断性分析:追溯事件发生原因

 

诊断性分析是数据分析中更具复杂性的后续步骤。在对描述性数据进行评估时,诊断性分析工具将有助于分析人员深入了解,从而在根本上解决问题。

精心设计的商务信息(BI)后台操作台既可读取时间序列数据(即多个连续时间点的数据),又具有诊断性分析所需的过滤和挖掘能力。

 

3. Predictive: What is likely to happen?

3. 预测性分析:预测可能发生事件

 

预测性分析主要在于预测。无论是将来发生事件的可能性,预测可量化数值还是估计可能发生事件的时间点 – 这些都是通过预测模型完成的。

预测模型通常利用各种可变数据进行预测。组成数据的多样性与可能预测的事件有关(例如,年龄越大的人,对心脏病发作的可能性就越高,我们可以说年龄与心脏病发作风险呈线性相关关系)。然后这些数据将被一起编译成分数形式或预测结果。

 

在这个充满不确定性的世界,预测能够使人做出更好的决策。预测模型是许多领域中所应用的一些最重要的模型。

 

4. Prescriptive: What do I need to do?

4. 指导性分析:指导需要做什么

 

在价值和复杂性方面更进一步的是指导性模型。指导性模型利用对已发生事件的理解,事件发生的原因,以及各种“可能发生的”情况分析来帮助用户确定可采取的最佳行动方案。指导性分析通常不仅是一个单独的分析行为,而实际上是一些其他分析行为的组合。

 

一个很好的例子是,一个交通应用程序帮助你选择最佳回家路线,并考虑到每个路线的距离,每条路上的行驶速度,以及当前的交通限制。

另一个例子可能是制作考试时间表,比如说一个使所有学生没有时间冲突的时间表。

medizin-de.com

虽然不同类型的分析可以为企业提供不等的价值,但它们都有各自的功能和用途,希望这份讲解,可以帮到你。

 


原文作者:Thomas Maydon, Principa.

作者简介:Thomas Maydon是Principa的信用解决方案负责人。Thomas在南非,西非和中东零售信贷市场拥有超过13年的经验,主要从事咨询,分析,信用测评和预测模型相关的服

务。