seaborn是基于matplotlib的Python可视化库,在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能让图变得精致好看。

一、kdeplot(核密度估计图)

核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属于非参数检验的方法之一。通过核密度估计图可以比较直观地看出数据样本本身的分布特征。

seaborn.kdeplot(data,data2=None,shade=False,vertical=False,kernel='gau',bw='scott',gridsize=100,cut=3,clip=None,legend=True,cumulative=False,shade_lowest=True,cbar=False, cbar_ax=None, cbar_kws=None, ax=None, *kwargs)

通过一些具体的例子来学习kdeplot的参数用法:

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

# 切换到seaborn的默认配置
sns.set()

# 绘制简单的一维数组,随机生成100个符合正态分布的数
x = np.random.randn(100)

sns.kdeplot(x)
plt.show()

三维核密度python代码 python 核密度图_python

cut参数:表示绘制的时候,切除带宽往数轴极限值的多少(默认为3)

sns.kdeplot(x,cut=0)

三维核密度python代码 python 核密度图_可视化_02

cumulative参数:是否绘制累积分布

sns.kdeplot(x,cumulative=True)

三维核密度python代码 python 核密度图_三维核密度python代码_03

shade参数:若为True,则在kde曲线下面的区域进行阴影处理,color空值曲线和阴影的颜色

sns.kdeplot(x,shade=True,color='red')

三维核密度python代码 python 核密度图_三维核密度python代码_04

vertical参数:表示以X轴进行绘制还是以Y轴进行绘制

sns.kdeplot(x,vertical=True)

三维核密度python代码 python 核密度图_三维核密度python代码_05

二元kde图像

y = np.random.randn(100)
sns.kdeplot(x,y,shade=True)

三维核密度python代码 python 核密度图_数据可视化_06

cbar参数:添加一个颜色棒(颜色棒在二元kde图像中才有)

sns.kdeplot(x,y,shade=True,cbar=True)

三维核密度python代码 python 核密度图_python_07

二、displot

distplot()集合了matplotlib的hist()与核密度函数kdeplot()的功能,增加了rugplot分布观察条显示与利用scipy库fit拟合参数分布的新颖用途。具体用法如下:

seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)

hist()表示直方图,又叫做质量分布图。通过表示沿数据范围形成封箱,然后绘制条形以显示落入每个分箱贯彻的次数的数据分布。

sns.distplot(x,color='r')

三维核密度python代码 python 核密度图_python_08

可以通过hist和kde参数调节是否显示直方图及和密度估计(默认hist,kde均为True)

# 创建一个一行三列的画布
fig,axes = plt.subplots(1,3)
# 左图
sns.distplot(x,ax=axes[0])
# 中图
sns.distplot(x,hist=False,ax=axes[1])
# 右图
sns.distplot(x,kde=False,ax=axes[2])

三维核密度python代码 python 核密度图_直方图_09

bins:int或list,控制直方图的划分

fig,axes = plt.subplots(1,2)
sns.distplot(x,kde=False,bins=20,ax=axes[0])
sns.distplot(x,kde=False,bins=[x for x in range(4)],ax=axes[1])

三维核密度python代码 python 核密度图_数据可视化_10

rug:控制是否生成观测数值的小细条

fig,axes = plt.subplots(1,2)
sns.distplot(x,rug=True,ax=axes[0])
sns.distplot(x,ax=axes[1])

三维核密度python代码 python 核密度图_数据可视化_11

fit:控制拟合的参数分布图形,能够直观地评估它与观察数据的对应关系(黑色线条为确定的分布)

# from scipy.stats import *
sns.distplot(x,hist=False,fit=norm)

三维核密度python代码 python 核密度图_数据可视化_12

hist_kws,kde_kws,rug_kws,fit_kws参数接收字典类型,可以自行定义更多高级样式

sns.distplot(x,kde_kws={'label':'KDE'},color='r')

三维核密度python代码 python 核密度图_可视化_13

norm_hist:若为True,则直方图高度显示密度而非计数(含有KDE图形中默认为True)

fig,axes = plt.subplots(1,2)
sns.distplot(x,norm_hist=True,kde=False,ax=axes[0])
sns.distplot(x,kde=False,ax=axes[1])

三维核密度python代码 python 核密度图_数据可视化_14