所谓分类变量的汇总展示,就是根据分类变量对样本进行分组,然后展示每一组的分布,适合多组数据的横向比较。在seaborn中,通过了柱状图,箱体图,小提琴图等多种可视化形式,来展示不同组数据的异同,具体的函数列表如下
1. stripplot,
2. swarmplot
3. boxplot
4. violinplot
5. boxenplot
6. pointplot
7. barplot
8. countplot
1. stripplot
该函数绘制的是扰动的散点图,基本用法如下
>>> df = pd.read_csv('tips.csv')
>>> sns.stripplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
2. swarmplot
该函数绘制的是蜜蜂图,基本用法如下
>>> sns.swarmplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
3. boxplot
该函数绘制的是箱体图,基本用法如下
>>> sns.boxplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
4. violinplot
该函数绘制的是小提琴图,基本用法如下
>>> sns.violinplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
5. boxenplot
该函数绘制的是增强版的箱体图,基本用法如下
>>> sns.boxenplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
6. pointplot
该函数统计分组变量的均值和标准差,用errorbar加折线图的形式展示,基本用法如下
>>> sns.pointplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
7. barplot
该函数统计分组变量的均值和标准差,用柱状图进行展示,基本用法如下
>>> sns.barplot(data=df, x="day", y="total_bill")
>>> plt.show()
输出结果如下
8.countplot
该函数统计每个组别下的样本个数,用柱状图展示,基本用法如下
>>> sns.countplot(data=df, x="day", hue="sex")
>>> plt.show()
输出结果如下
上述各种函数对应的figure-level级别的函数为catplot, 基本用法如下
>>> sns.catplot(data=df, x="day", y="total_bill", col='sex')
>>> plt.show()
输出结果如下
对于分类变量的比较和展示,seaborn提供了多种可视化方式,而且内置了统计功能,我们只需要体用数据,就可以直接得到美观的统计图表了,非常的便利。
·end·
一个只分享干货的
生信公众号