okx

让数据动起来,PPT更生动

时间:2023-06-19|浏览:126

选自 Towards Data Science

机器之心编译

参与:Jamin、张倩

在读技术博客的过程中,我们会发现那些能够把知识、成果讲透的博主很多都会做动态图表。他们的图是怎么做的?难度大吗?这篇文章就介绍了 Python 中一种简单的动态图表制作方法。

数据暴增的年代,数据科学家、分析师在被要求对数据有更深的理解与分析的同时,还需要将结果有效地传递给他人。如何让目标听众更直观地理解?当然是将数据可视化啊,而且最好是动态可视化。

本文将以线型图、条形图和饼图为例,系统地讲解如何让你的数据图表动起来。

这些动态图表是用什么做的?

接触过数据可视化的同学应该对 Python 里的 Matplotlib 库并不陌生。它是一个基于 Python 的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——FuncAnimation,可以让我们的静态图表动起来。

FuncAnimation 是 Matplotlib 库中 Animation 类的一部分,后续会展示多个示例。如果是首次接触,你可以将这个函数简单地理解为一个 While 循环,不停地在“画布”上

import matplotlib.animation as ani

animator = ani.FuncAnimation(fig, chartfunc, interval=100)

从中我们可以看到 FuncAnimation 的几个输入:

fig 是用来「绘制图表」的 figure 对象;

chartfunc 是一个以数字为输入的函数,其含义为时间序列上的时间;

interval 这个更好理解,是帧之间的间隔延迟,以毫秒为单位,默认值为 200。

这是三个关键输入,当然还有更多可选输入,感兴趣的读者可查看原文档,这里不再赘述。

下一步要做的就是将数据图表参数化,从而转换为一个函数,然后将该函数时间序列中的点设置完成后就可以正式开始了。

在开始之前依旧需要确认你是否对基本的数据可视化有所了解。也就是说,我们先要将数据进行可视化处理,再进行动态处理。

按照以下代码进行基本调用。另外,这里将采用大型流行病的传播数据作为案例数据(包括每天的死亡人数)。

import matplotlib.animation as ani import matplotlib.pyplot as plt import numpy as np import pandas as pd

url = "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv" df = pd.read_csv(url, delimiter=",", header="infer") df_interest = df.loc[ df["Country/Region"].isin(["United Kingdom", "US", "Italy", "Germany"]) & df["Province/State"].isna() ] df_interest.rename(index=lambda x: df_interest.at[x, "Country/Region"], inplace=True) df1 = df_interest.transpose() df1 = df1.drop(["Province/State", "Country/Region", "Lat", "Long"]) df1 = df1.loc[(df1 != 0).any(1)] df1.index = pd.to_datetime(df1.index)

绘制三种常见动态图表

绘制动态线型图

如下所示,首先需要做的第一件事是定义图的各项,这些基础项设定之后就会保持不变。它们包括:创建 figure 对象,x 标和 y 标,设置线条颜色和 figure 边距等:

import numpy as np import matplotlib.pyplot as plt

color = ["red", "green", "blue", "orange"] fig=plt.figure plt.xticks(rotation=45, ha="right", rotation_mode="anchor") # rotate the x-axis values plt.subplots_adjust(bottom=0.2, top=0.9) # ensuring the dates (on the x-axis) fit in the screen plt.ylabel("No of Deaths") plt.xlabel("Dates")

接下来设置 curve 函数,进而使用 .FuncAnimation 让它动起来:

def buildmebarchart(i=int): plt.legend(df1.columns) p=plt.plot(df1[:i].index,df1[:i].values) # note it only returns the dataset, upto the point i for i in range(0, 4): p[i].set_color(color[i]) # set the colour of each curve

import matplotlib.animation as ani animator = ani.FuncAnimation(fig, buildmebarchart, interval=100) plt.show

动态饼状图

可以观察到,其代码结构看起来与线型图并无太大差异,但依旧有细小的差别。

import numpy as np import matplotlib.pyplot as plt

fig, ax = plt.subplots() explode = [0.01, 0.01, 0.01, 0.01] # pop out each slice from the pie

def getmepie(i): def absolute_value(val): # turn % back to a number a = np.round(val/100.*df1.head(i).max().sum(), 0) return int(a) ax.clear plot = df1.head(i).max().plot.pie(y=df1.columns, autopct=absolute_value, label="", explode=explode, shadow=True) plot.set_title("Total Number of Deaths " + str(df1.index[min(i, len(df1.index)-1)].strftime("%y-%m-%d")), fontsize=12)

import matplotlib.animation as ani animator = ani.FuncAnimation(fig, getmepie, interval=200) plt.show

主要区别在于,动态饼状图的代码每次循环都会返回一组数值,但在线型图中返回的是我们所在点之前的整个时间序列。返回时间序列通过 df1.head(i) 来实现,而 .max 则保证了我们仅获得最新的数据,因为流行病导致死亡的总数只有两种变化:维持现有数量或持续上升。

df1.head(i).max

动态条形图

创建动态条形图的难度与上述两个案例并无太大差别。在这个案例中,作者定义了水平和垂直两种条形图,读者可以根据自己的实

热点:数据

« 上一条| 下一条 »
区块链交流群
数藏交流群

合作伙伴

趣玩币 币圈ICO官网 趣开心资讯 宠物丫 妈妈知道 玩票票财经 起名取名网 美白没斑啦 乐评网 百科书库 百悦米 币圈官网 二手域名 币圈论坛 金色币圈 爱网站 非小号行情 黄金行情 宝宝起名 币爸爸 元宇宙Web 佩佩蛙官网 借春秋财经 借春秋 天天财富 玩合约 培训资讯网 旅游资讯网 去玩呗SPA 数字财经 周公解梦 谈股票 秒懂域名 聚币网 减肥瘦身吧 装修装饰网 兼职信息网 數字黃金 茶百科 今日黄金 皮卡丘资讯 代特币圈
在区块链世界中,智能合约不仅是代码的信任,更是商业的革命。通过了解其在供应链、版权保护等领域的应用,您将真正体验到智能合约的无限可能性
区块链世界GxPiKaQiu.com ©2020-2024版权所有 桂ICP备16002597号-2