引言:ggplot2基本要素

“+”和“%+%”

数据(data)和映射(mapping):想要可视化的数据(data)以及一系列将数据中的变量对应到图形属性的映射(mapping);ggplot2的数据(data)必须是一个数据框(dataframe)。

几何对象(geometric):几何对象(geom)代表你在图中实际看到的元素,如点、线、多边形等。

统计变换(statistics):统计变换(stat)是对数据进行的某种汇总。例如将数据分组计数以创建直方图,或将一个二维的关系用线性模型进行解释。统计变换是可选的,但通常非常有用。

标度(Scale):标度(scale)的作用是将数据的取值映射到图形空间,例如用颜色、大小或形状来表示不同的取值。展现标度的常见做法是绘制图例和坐标轴——它们实际上是从图形到数据的一个映射,使你可以从图形中读取原始的数据。标度包括位置、颜色、大小、形状、线型。

坐标系统(Coordinate):坐标系(coord)描述了数据是如何映射到图形所在的平面的,它同时提供了看图所需的坐标轴和网格线。我们通常使用的是笛卡尔坐标系,但也可以将其变换为其它类型,如极坐标和地图投影。

图层(Layer):图层的作用是生成在图像上可以被人感知的图形。一个图层由4部分组成:数据和图形属性映射;一种统计变换;一种几何对象;一种位置调整方式。

分面(Facet):分面(facet)描述了如何将数据分解为各个子集,以及如何对子集作图并联合进行展示。分面也叫作条件作图或网格作图。

其中各要素通过“+”以图层(layer)的方式来粘合构图(可以简单理解为要素/图层叠加符号);另外在ggplot2中,数据集必须为数据框(data.frame)格式,并且可以通过%+%符号调整已有数据集(ggplot2指导文档中明确写出“To override the data, you must use %+%”,也就是覆盖数据必须通过%+%)。以mpg数据集为例。

#绘制基本ggplot图base 
#用%+%调整映射关系中的数据base 
#第二种调整数据的方法list# Alternatively, you can add multiple components witha list.# This can be useful to returnfroma function.p3
###########一页多图########library(grid)grid.newpage() ##新建页面pushViewport(viewport(layout = grid.layout(2,2))) #将页面分成2*2矩阵vplayout
print(p1, vp = vplayout(1,1)) #(1,1)的位置画图1print(p2, vp = vplayout(1,2)) #(1,2)的位置画图2print(p3, vp = vplayout(2,1)) #(2,1)的位置画图3


1. 数据(Data)和映射(Mapping)

前文已经提及在ggplot2中,数据集必须为数据框(data.frame)格式,并且可以通过%+%符号调整已有数据集。

映射是将一个变量中离散或连续的数据与一个图形属性中以不同的参数来相互关联, 而设定能够将这个变量中所有的数据统一为一个图形属性。aes函数是ggplot2中的映射函数, 所谓的映射即为数据集中的数据关联到相应的图形属性过程中一种对应关系(注意第10行)。可以发现, 在p2中, 通过aes指定了横纵坐标分别为wt和hp

> p2 summary(p2)data: mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb [32x11]mapping: x = ~wt, y = ~hpfaceting: …… #此部分省略一些内容

另外,在ggplot2中,ggplot函数声明了全局数据和映射关系,在后续几何对象中如未重新设定数据和映射关系,几何对象将沿用ggplot中声明的数据与映射关系;

当然几何对象可重新设定数据与映射关系,并作用于此几何对象(对比图4和图7),但并不对初始图图层产生影响(对比图4和图6,图6虽对几何图形中重新定义y变量为carb,但纵坐标依然是wt)。

p4

p5

df

###########一页多图#########library(grid)grid.newpage ##新建页面pushViewport(viewport(layout = grid.layout(2,2))) #将页面分成2*2矩阵vplayout 
print(p4, vp = vplayout(1,1)) #(1,1)的位置画图4print(p5, vp = vplayout(1,2)) #(1,2)的位置画图5print(p6, vp = vplayout(2,1)) #(2,1)的位置画图6print(p7, vp = vplayout(2,2)) #(2,2)的位置画图7

2、几何对象(Geometric)

上述例子中,数据映射关系有ggplot函数设定,使用geom_point添加一个几何图层,告诉ggplot绘画点图,并将图层属性映射到散点上。

geom_point之外,ggplot2提供了多种几何对象映射,如geom_histogram直方图,geom_bar画柱状图,geom_boxplot画箱式图等等。不同的几何对象,要求的属性会有些不同,这些属性也可以在几何对象映射时提供。

p

###########一页多图#########library(grid)grid.newpage ##新建页面pushViewport(viewport(layout = grid.layout(1,2))) #将页面分成2*2矩阵vplayout 
print(p8, vp = vplayout(1,1)) #(1,1)的位置画图8print(p9, vp = vplayout(1,2)) #(1,2)的位置画图9


3、标度(Scale):fill、color、shape

在对图形属性进行映射之后,使用标度可以控制这些属性的显示方式,比如颜色属性、形状属性等。

对比图10和图11,aes中color参数属性可以发现,如color对应变量为factor因子时,图10中图例分组显示不同颜色;但如factor对应的变量为数值,ggplot将其识别为连续变量,数值大小决定颜色深度;对比12和图13,不论是在ggplot函数中定义color还是在几何对象中定义color,其具有相同的效果。

p

p

###########一页多图#########library(grid)grid.newpage ##新建页面pushViewport(viewport(layout = grid.layout(2,2))) #将页面分成2*2矩阵vplayout 
print(p10, vp = vplayout(1,1)) #(1,1)的位置画图10print(p11, vp = vplayout(1,2)) #(1,2)的位置画图11print(p12, vp = vplayout(2,1)) #(2,1)的位置画图12print(p13, vp = vplayout(2,2)) #(2,2)的位置画图13


4、统计变换(Stat)

统计变换对原始数据进行某种计算,然后在图上显示出来,例如在散点图上加一条回归线。


aes所提供的参数,就通过ggplot提供,而不是提供给geom_point,因为ggplot里的参数,相当于全局变量,geom_point和stat_smooth都知道x,y的映射,如果只提供给geom_point,则相当于是局部变量。ggplot2提供了多种统计变换方式:

5、坐标系统(Coordinante)

坐标系统控制坐标轴进行变换,例如XY轴翻转,笛卡尔坐标和极坐标转换。

#坐标轴翻转由coord_flip实现p15 
#转换成极坐标可以由coord_polar实现:风玫瑰图(windrose)p16 
#转换成极坐标可以由coord_polar实现:风玫瑰图(windrose)p17 
###########一页多图#########library(grid)grid.newpage ##新建页面pushViewport(viewport(layout = grid.layout(2,2))) #将页面分成2*2矩阵vplayout 
print(p14, vp = vplayout(1,1)) #(1,1)的位置画图14print(p15, vp = vplayout(1,2)) #(1,2)的位置画图15print(p16, vp = vplayout(2,1)) #(2,1)的位置画图16print(p17, vp = vplayout(2,2)) #(2,2)的位置画图17


6、分面(Facet)

分面可以让我们按照某种给定的条件,对数据进行分组,然后分别画图。



7、主题(Theme)

###########一页多图#########library(grid)grid.newpage ##新建页面pushViewport(viewport(layout = grid.layout(2,2))) #将页面分成2*2矩阵vplayout 
print(p1, vp = vplayout(1,1)) #(1,1)的位置画图20print(p17, vp = vplayout(1,2)) #(1,2)的位置画图17print(p18, vp = vplayout(2,1)) #(2,1)的位置画图18print(p19, vp = vplayout(2,2)) #(2,2)的位置画图19


8 实例


【ggplot2函数速查表】