Pandas提供的Plot()方法可以将串行数据和DataFrame可视化,data frame是https://www.zhucesz.com/的封装,执行后会生成一个可视化图形,直接显示在Jupyter笔记本上。
默认情况下,Plot是一个折线图,X轴表示指数,Y轴表示数据。
(1)对于DataFrame,所有数字列将以多条虚线的形式显示在图形中。
(2)其他图形:
(1)数列数据调用plot方法,其索引信息会显示在x轴上,而y轴是x轴上索引对应的具体数据值。
(2)数据帧数据:
调用plot时,X轴是DataFrame的索引,Y轴会显示多列折线数据。
绘制数据帧时,可以指定X轴和Y轴的列。
如果Y轴需要多个值,您可以将它们传递到列表中:
(1)种类参数,它可以指定图形的类型:
(2)2)kind支持的参数如下:
折线图:折线图,默认;饼图:饼图;条形图:柱形图;Barh:水平直方图;Hist:直方图;Kde,density:核密度估计图;方框:方框图;面积:面积图;散点图:散点图;Hexbin:六角盒绘图。
如果是Series,索引就是X轴,不需要传入Y轴的值。
使用title参数指定图形的标题,标题将显示在图形的顶部。
Tsize指定轴上的字体大小,以磅为单位。
样式您可以指定图表的线条样式,并结合使用:
网格将向x和y方向添加背景参考线:
(1)plot默认显示图例,传入参数legend=False可以隐藏。
(2)颠倒图例(与前一个顺序相反)。
figsize参数传入一个元组,该元组可以指定图形的宽度和高度(以英寸为单位)。
全局默认图形大小:
Colormap指定图形颜色方案。
backend参数可以指定一个新的绘图引擎,默认为Matplotlib。
(1)用bokeh代替绘图引擎,bokeh是一个优秀的交互式Python可视化绘图库。
上面的代码执行后,会先加载bokeh的JavaScript等静态资源,然后显示交互图形。您可以单击页面上的各种操作按钮来浏览数据。
(2)Pandas支持以下绘图引擎:
Matplotlib(默认)HV Plot https://www.zhucesz.com/版及以上Holoviewstandas _ Bokehplotly https://www.zhucesz.com/版及以上Altair
为了实现两类图的叠加,可以将两个图的绘图语句组合成一个元组或一个列表。
在可视化中,颜色的表示方式与CSS相同,可以用CSS颜色名称和CSS合法颜色值来表示。
(1)17种标准颜色名称:水绿色、黑色、蓝色、紫红色、灰色、绿色、石灰色、栗色、藏青色、橄榄色、橙色、紫色、红色、银色、蓝绿色、白色和黄色。
(2)法律色彩价值。在HTML和CSS中,使用3位元素。总共6个十六进制数字代表一种颜色。每个元素的取值范围从00到FF,相当于十进制数字的0到255。按照这个顺序,前两位是红色值,中间两位是绿色值,后两位是蓝色值。
(3)rgb(红绿蓝)格式:如rgb(37,37,37)。
(1)临时方案
(2)永久方案:在配置文件中添加指定的中文字体。
本节将介绍plot()方法改编的一些最常用的图形绘制方法,无需额外参数即可快速可视化数据。
plot的默认图形是折线图,所以对于折线图可以省略https://www.zhucesz.com/()中的line方法。
(1)DataFrame可以直接调用plot生成折线图。
X轴为索引,其他数字类型的列为Y轴上的线。
如果要将指定列作为X轴,可以先将其设置为索引。
(2)以系列指数为X轴,数值为Y轴。如果该值不是数字,将会报告一个错误:
(3)可以指定X轴和Y轴:
(4)如果折线图中有多条线,可以用支线剧情来区分,形成多个子图。
饼状图可以显示不同种类的数据在整体中所占的比例,将一个完整的圆分成若干个小蛋糕,比例以弧度体现。
如果数据中有NaN值,则自动填充为0;如果数据中有负值,将引发ValueError错误。
(1)对于系列:
(2)对于DataFrame,需要指定Y值。
(3)如果数据之和小于https://www.zhucesz.com/,将抽取一个扇形。
(4)DataFrame可以传入subplots=True来创建子图矩阵。
(5)默认有图例,但可以通过传入参数legend=False来设置。
(6)其他常用参数:
(1)DataFrame直接调用https://www.zhucesz.com/生成直方图。
X轴是索引,其他数字类型的列是Y轴上的条:
如果要在X轴上显示指定的列,可以将其设置为索引:
(2)数列指标是X轴,数值是Y轴。当存在非数字值时,将会报告错误。
如果数据中有负值,0刻度将在X轴上,而不是在图形的底部边缘:
堆叠同一指标的多个数据:
(3)直方图也支持子图,使用subplots=True。
直方图又称质量分布图,是由一系列不同高度的纵向条纹或线段组成,用以表示数据分布。通常,横轴表示数据类型,纵轴表示分布。
直方图描述的是数据在不同区间的分布情况,描述的数据量一般较大。分组数据字段(统计结果)映射到水平轴,频率字段(统计结果)映射到矩形的高度。您可以设置分类数据的颜色,以增加分类的区分度。
(1)在下面的例子中,随机生成三列,每列1000,其中一列随机数加1,一列随机数减1,然后绘制直方图。默认的箱数是10(箱=10),alpha是颜色的透明度(范围0~1):
(2)系列是单一直方图:
(3)堆叠并指定箱子的数量:
(4)用https://www . https://www.zhucesz.com/(alpha=https://www.zhucesz.com/)直接画出子图:
(5)可以单独绘制子图,以指定子框的数量:
(6)by参数可用于分组以生成分组子图:
箱线图,又称盒图、箱线图或盒线图,是用来表示一组数据分布情况的统计图表。
3359 https://www.zhucesz.com/()3359 www . https://www.zhucesz.com/()和3359 www . https://www.zhucesz.com/()都可以画箱线图。
3359 https://www.zhucesz.com/()无法使用,找不到原因。
(1)从方框图中可以观察到:
一组数据的关键值,如中值、最大值和最小值;数据集中是否存在异常值以及异常值的具体值;数据是否对称;数据分布是否密集;数据是否失真,即有偏差?
(2)用法
(3)其他方法:
(4)使用vert=False将图形设置为横向,并使用position来控制位置:
面积图也叫面积图。折线图中折线与自变量坐标轴之间的区域用颜色或纹理填充,所以填充的区域称为面积。填充颜色可以更好地突出趋势信息。
默认情况下,面积图是堆叠的。
要生成累计面积图,每列必须全部为正或全部为负。
当输入数据包含NaN时,将用0填充。
如果你想删除或填入不同的值,你需要在调用图形之前使用https://www.zhucesz.com/()或https://www.zhucesz.com/()。
3359 https://www.zhucesz.com/()和* * 3359 https://www.zhucesz.com/() * *是面积图的基本操作。默认情况下,X轴是索引,Y轴是值或所有数据列。
(1)单柱:
(2)所有数据列:
(3)生成一个不堆叠且有一定透明度的图形,传入stack=False,Alpha的默认值为https://www.zhucesz.com/:
(4)指定X轴和Y轴:
散点图也叫x-y图,是将直角坐标系中的所有数据以点的形式显示出来,以表示变量之间相互影响的程度。点的位置由变量的值决定。
(1)可以用https://www.zhucesz.com/()方法画散点图。散点图要求X轴和Y轴为数字列,可以通过X和Y关键字指定。
(2)使用C参数指定点的颜色:
c可以取以下值:
字符、RGB或RGBA码,如红色、# A98D19序列,颜色列表,每个点对应的颜色;列或位置;
(3)参数colorbar=True会在当前坐标区域或图形右侧显示一个垂直的颜色条,显示当前的颜色图,并指明数值与颜色图之间的映射关系。
(4)参数s用于指定点的大小。
六边形盒图又称六边形盒图,是以六边形为主要元素的统计图。它不仅是散点图的扩展,还具有直方图和热图的特点。
3359 https://www.zhucesz.com/()无法使用,找不到原因。
使用**https://www.zhucesz.com/()**创建一个六边形图。如果数据过于密集,无法单独绘制每个点,可以使用六边形图。