Plotly实现5种经典简便的可互动图表

Plotly实现5种经典简便的可互动图表

使用Plotly不仅能做直方图和箱型图

讲故事是我们数据科学家的一项必备技能。我们需要有效的交流来传达我们的观点并且说服客户。而漂亮的可视化正是一种绝佳的工具。本文涵盖了5项超越经典类型的可视化技术,能让你的数据故事更加美观有效。我们将采用Python中的Plotly图形库(在R中也有),它能以较低的成本提供动画式和可互动的图表。(见:https://plotly.com/python/)

Plotly好在哪里呢

Plotly图表是高度综合性的:它们能用于Jupyter记事本,可以嵌入网页,也能完全整合进Dash中,后者是一款用于建立仪表板和分析性应用程序的优秀工具。

起步

如果你还没安装Plotly,使用以下命令就可以了:

现在万事俱备,开始吧!

1 动画 Animations

当研究各种指标的演化时,我们的工作往往涉及时间数据。Plotly动画工具可以让你只用一行代码就能观察数据如何随时间变化。

只要你有一个时间变量可供筛选,几乎任何图表都可以动画化。例如用以下代码动画画散点图:

2 日光图Sunburst Charts

日光图是对你的group by语句做可视化的好方法。如果你想用一个或多个类别变量对给定的数据做细分,那就用日光图吧。

例如,我们想用性别和时间对每日平均小费金额做细分。这是一个双重group by语句,用可视化比用表格能更有效地进行展示:

所得图形是可互动的,能让你进行点击,单独探索各个类别。你要做的只是定义好所有的分类,表明它们之间的等级(见代码中的parents部分),赋上相应的值,即我们例中的group by输出结果。

现在,来给我们的分级再加一层:

我们只要在values部分另加一项group by语句就可以了,其中要包含3个分类变量。

3 平行分类 Parallel Categories

探索分类变量之间关系的另一个方法是流程图。你可以随时进行拖放、高亮、探索数值等操作,这对于做汇报来说十分有用。

4 平行坐标 Parallel Coordinates

平行坐标画的是上面图形的连续版。其中每一根弦代表着一个单独的观测点。该工具适用于发现离群值(孤立于其它数据的线)、簇类、趋势和冗余变量(例如,若两个变量在各个观测点上拥有相似的值,那么它们就会处于一条平行线上,表明冗余)。

5 量规表与指示符
Gauge Charts and Indicators

做量规表仅仅是为了美观。适用于汇报那些同你的目标相关联的成功指标或KPI。

指示符在商业咨询语境下很有用。它们用文本标记对你的可视化进行补充,能够抓住观众的注意力,传达你的增长指标。

原文作者:Liana Mehrabyan

翻译作者:Siyu Hao

美工编辑:过儿

校对审稿:Dongdong

原文链接:https://towardsdatascience.com/5-visualisations-to-level-up-your-data-story-e131759c2f41