【科研猫·绘图】看·箱线图·如何美丽动人(代码分享)

  • 2019 年 10 月 6 日
  • 筆記

往期的教程里详细为大家做了R语言安装和环境配置的课程,错过的喵咪们,课前赶紧复习一下吧。生物信息系列课程-R语言入门挖掘GEO速成SCI文章系列教程(3)-R语言基础。古语云“字如其人”,现在讲“第一印象”,说的都是形象、气质的重要作用,在科研领域而言,规范的、高质量的图片是发表高水平文章的必备条件。有请我们科研猫特聘作图系列讲师,飞飞老师~

俗话说的好,“一图顶十表”。我们经常在Nature,Science杂志的各种高级文章中看到异常优美的图片,大都是这样色儿的:

很多审稿人看稿件的顺序都是题目、摘要、图表,然后才是前言、参考文献和正文。由此可见图表作为一篇文章的“脸面”,图画的好,就能给Reviewer和Editor留下良好的第一印象。!有了印象分,投稿成功率才能提高。

看过CNS级别的图,惊叹于大神们神乎其技的作图技术,我们再来审视一下自己,看看我们画的图都长什么样子:

可能有些同学会说,这个图挺好的呀,也没什么问题。但是仔细比较一下,就会发现这些的图从细节、图形外观、配色等诸多问题上,跟别人家的“白富美”图相比,“菜色”满满,难以望其项背也。

那么如何才能绘制出美观的图形呢,从本次课程开始,科研猫推出《科研绘图系列课程》,我们将会逐一跟大家讲解每个图形的特点以及如何绘制出漂亮的科研图形。整个学习过程中,会涉及R语言、Adobe Illustrator、Adobe Photoshop等多种绘图工具,帮助大家绘制所有你看到过的、没看到过的、无法想象、难以绘制的各类图形。

今天,我们从最常用的一个图形入手:箱线图。在我们日常使用的图形中,箱线图属于使用频率最高的图形之一。

箱·线·图

定义:Boxplot,又称为盒须图、盒式图,是用于显示一组数据分散情况资料的统计图,因形状如箱子而得名。在诸多种领域里广泛应用,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

解读:箱线图既然常用于统计数据的特征描述,其每个框线都是有特殊含义的。箱线图包括了一组数据的最大值、最小值、中位数和两个四分位数。首先,连接两个四分位数画出箱子;其次,再将最大值和最小值与箱子相连接,而中位数则在箱子中间。具体如下:

绘制方法:在R语言中,使用boxplot函数画出箱子和背景,结合beeswarm包生成蜜蜂群点,再结合RColorBrewer包对其进行配色。

绘图操作:直接使用 科研猫·箱线图R代码,读取数据,设置几个参数即可:

(1)设置要读取的文件;

(2)设置Box的颜色,可以是red、blue、green等各种颜色,当你想绘制多种颜色时,使用“random”;

(3)设置点的颜色;

然后直接运行代码即可。

画出来的图是下面这样子的,是不是有高大上之感了呢。在绘制Boxplot的同时,把每个数据点的分布位置都详细描述出来。据我所知,不管是SPSS、SAS还是大家常用的GraphPad,目前都是无法完成如此之美图的。

看了这么漂亮的图,有没有感受到飞飞老师的高超技艺呢?围观一下她的豪华简历吧

讲师简介:

飞飞老师,绰号“小飞鼠”,国家重点实验室生物信息学博士,生物信息及动画专业双985学士,有近十年科研绘图经验,精通R、Python、Perl等多门编程语言及Photoshop、Illustrator、InDesign、After Effects、Cinema 4D、Maya等制图软件,已发表多篇高质量SCI论文(包括10分以上两篇),并多次操刀设计Journal封面绘图。授课经验丰富,已辅导学员完成论文绘图近千张,辅导发表SCI论文80余篇。下面我们一起按照由易到难的顺序,一起来欣赏一下飞飞老师的大作吧:

1. 初级统计绘图

2.复杂统计绘图

3.流程图、机器学习、三维制图

4.复杂三维绘图、杂志封面

更多科研新鲜资讯、文献精度和生物信息技能,请关注科研猫公众号