R语言从入门到精通:Day8

  • 2019 年 10 月 6 日
  • 筆記

是时候 关注 我们一波了 在上一次教程中,我们讲解了R语言绘图的诸多函数,想必看到自己做出的图形,肯定小有成就感吧。上期的最后,给大家预告了一部分本次教程的内容:图形的组合,除此之外,我们在讲讲基本图形的绘制(条形图、散点图、饼图、直方图等),赶紧开始battle起来吧

本篇教程,内容十分丰富,虽然是单篇,大家务必多多练习,可以充当一周的学习内容,静下心来慢慢吸收。

温馨提示

1、本节内容重点内容较多,

务必紧跟红色标记。

2、测试数据及代码

见文末客服小姐姐二维码。

图形的组合

图形的组合,顾名思义,就是将两张或者更多图形放在一起展示。在R中,一般使用函数 par() 或者 layout() 组合多幅图形。其中par()图形参数mfrow=c(nrows, ncols) 来创建按行填充的、行数为nrows、列数为ncols的图形矩阵。另外,可以使用 mfcol=c(nrows, ncols) 按列填充矩阵。

下面是两张函数 par() 中mfrow参数的实例。

在函数par()和函数layout()的举例中,不可避免的使用到了散点图、条形图、箱线图等图形的绘制,这些内容也会在本次推文中提到,图形组合中的几个例子算是先给大家热热身。

图1:函数par(),参数mfrow的实例1

图2:函数par(),参数mfrow的实例2

参数mfcol的使用是类似的,就不重复举例了。

函数 layout() 的参数要更复杂一些,同时对图形布局的控制也更加精细。该函数通过 layout(mat) 的形式实现图形的布局,其中 mat 是一个指定布局情况的矩阵。同时函数 layout() 中有 widths 和 heights 两个参数控制组合图形中单个图形的宽度和高度的比例。同样的,我们为大家提供了两个学习的例子。

图3:函数layout()的例子1

图4:函数layout()的例子2

如果在运行上面四幅图形的代码时出现了类似 Error in plot.new() : figure margins too large 这样的错误,可以尝试将 Rstudio 中的“绘图区”放大一些,并不是我们的代码出错啦~~。

上面的几个例子虽然实现了图形的组合,但我们还需要更加精细的组合方法,函数 par() 中的参数 fig 可以帮忙。下面是一个典型的例子。

图5:参数fig的实例

参数 fig 的使用可以理解为给每一幅图形以坐标系的方式指定绘图区域。将整个绘图区域理解为横坐标为 0 到 1、纵坐标为 0 到 1 的正方形区域,上图中散点图的绘图区为横坐标 0 到 0.8、纵坐标 0 到 0.8 的区域,上方的箱线图绘图区域为横坐标 0 到 0.8、纵坐标为 0.55 到 1 的区域。

这里区域的划分看上去好像和散点图重叠了,但实际效果并不是,因为每幅图形都有空白边界,同时区域的划分并不是一成不变的,需要在实际绘图中不断调整得到最美观简洁同时准确表达图形含义的效果

右边的箱线图的区域则为横坐标 0.65 到 1、纵坐标 0 到 0.8。相信大家在多次练习之后就可以用参数 fig 绘制出更加复杂美观的图形。

基本图形的绘制

在上面的几个例子中,我们已经接触到了散点图、条形图、箱线图的绘制,本次推文的剩余内容就是介绍这些基本图形的绘制。

基本图形主要包括了点图、条形图、箱线图、饼图、扇形图和核密度图等,这些图形的目的主要有两点:将数据的分布可视化展示、对数据进行跨组比较。下面就从条形图开始介绍基本图形的绘制。

条形图

条形图通过垂直的或水平的条形展示了类别型变量的分布(频数),在R中对应函数 barplot()。下面是几个简单的例子。

图6:简单条形图

图7:堆砌条形图和分组条形图

为了方便大家重复图形绘制过程,上面图形中展示的数据都是来自包vcd ,大家在运行代码前安装vcd包即可。其中图6中展示了简单条形图的绘制,图7中展示了堆砌条形图和分组条形图的绘制。图7中出现了图例与图形重叠的现象,大家可以回顾一下上一次推文中图例设置的内容,调整图例的大小和位置,就可以解决这个问题。(这个小问题就留给大家区解决了)

从上面这个问题可以看出,只有三个变量的情况下都不可避免的出现了图例和图形重叠的情况,更复杂的情况该怎么办?不用担心,条形图中的各种元素都是可以微调的,以图6中的第二幅图为例,调整图中文本的方向和大小使得图形更加简洁清晰。

图8:条形图的微调。

还有一种特殊但常见的条形图:棘状图。棘状图对堆砌条形图进行了重缩放,这样每个条形的高度均为1,每一段的高度即表示比例,可以通过vcd包中的函数spine()绘制。例子如下:

图9: 棘状图实例

饼图or扇形图

相比于条形图,饼图或者扇形图在R中不太受欢迎,因为我们对长度的比较总是比对面积的比较要更加敏感。即便如此,我们要为大家提供了一些饼图的实例。主要涉及函数 pie()、函数 pie3D()、函数 fan.plot()。

图10:饼图实例

图11:扇形图实例。

饼图中建议标注上每个变量的信息,否则分辨面积的大小不是一件容易的事情,特别是当差异很小的时候!相比之下,就不难理解为什么条形图更受欢迎了。

直方图

直方图和条形图很类似,但它描述的是连续型变量的分布。前面介绍图形组合的时候,我们已经接触了直方图的绘制,下面给大家一些更加细致的例子。

图12:直方图示例

第一幅图形就是最简单的直方图绘制,余下的三幅图都是在函数 hist() 中调整参数或者加上其他元素而绘制的图形,其中第三、四幅图形中加上了密度曲线(在后面会进一步介绍),这是很常见的处理方式。

在图12中的密度曲线有时候会单独出现,这时候被称为核密度图。绘制核密度图的方法在图12的代码中已经出现了 (plot(density(x)),下面是几个单独的例子。

图13:核密度图的示例

第一幅图形是最简单的核密度图,第二幅图形加上了一些微调。第三幅图形是三个密度曲线比较的图形,其中需要安装包sm。同时代码中用到了参数locator(使用这个参数之后,我们可以用鼠标选择图例的位置,避免了有时候无法处理图形和图例位置关系的尴尬)。

小提琴图

还有一种常见又美观的图形——箱线图(小提琴图是一种特殊的箱线图),其实我们在图形组合中也见过了,绘制方法为函数 boxplot()。小提琴图的绘制方法为vioplot()。最简单的箱线图的例子就不给大家重复了,下面是一幅展示了箱线图中各个元素含义的简图。

图14:箱线图含义解析

箱线图

箱线图的绘制是很灵活的,下面是几个实例。

图15:箱线图示例

第一幅图利用箱线图进行了跨组比较,第二幅图通过参数 notch 实现了凹槽箱线图的绘制,第三幅图的比较更复杂一些,但基本原理是类似的。

小提琴图

箱线图能很好的展示组间的差异,核密度图能很好的展示组内的分布,如果把这两种图形结合起来是不是听上去就很完美?小提琴图就是这样的一种图形,读过科研猫前面推文的同学应该对小提琴图的绘制还有印象,我们这里有更容易理解的代码(因为只有一行,一个函数 vioplot() 啊)。

图16:小提琴图示例

点图

最后我们用点图结束本次推文的所有内容,函数 dotchart() 可以绘制点图。

图17:点图的示例

在上图中,我们调整了函数 dotchart() 中的很多参数,可以看到简单的点图也可以展示出很多有用的信息,但是点图的实用性随着数据点的增多会急剧减小。

综合来说,图形的潜力是巨大的,我们下一次的推文还要进一步展示图形说明数据内在关系的能力。

最后,为了方便大家学习,本次推文中所有图形的数据都来自R自带或者R中函数包自带,图形及相关代码都可以通过客服小姐姐获得。

本期干货

·

!R语言图形day8图形绘制 !

原文详情:“科研猫”公众号