从网络图探寻基因互作的蛛丝马迹(4)
- 2019 年 10 月 6 日
- 筆記
在前面的3期中,我们给大家讲解了网络图的构造、 STRING数据库和Cytoscape软件的安装,链接如下:
还记得我们的研究课题吗?
如何从100多个差异表达的基因当中快速锁定关键基因
这个课题的分析步骤分了几个步骤:
1、从基因列表到蛋白互作;
2、从蛋白互作到互作网络;
3、从互作网络到关键基因。
我们已经完成了第一步,并且在 STRING 数据库当中绘制了一个简单的网络图,可惜这个网络图没有办法进一步在 STRING 当中进行美化,也没办法通过算法找到里面的关键基因,怎么办呢?
这时候就依赖 Cytoscape 了,关于 Cytoscape 的软件简介和安装调试我们已经讲过了,这次,我们就来演示最关键的内容,Cytoscape的使用。我们还是从上次的实例出发,边演示边讲解。
Attention
软件操作略复杂,
因此文末配备了超长无码讲解视频。
网络文件格式包括多种格式:TXT、SIF、GML等,这些都是 Cytoscape 能够识别的,其中最常用的就是 TXT 文本文件。这种格式是最简单的,其实就是从 Excel 中复制出来的表格,其格式是这样的:
(1)第一行,默认作为列名,所以不要有重复性的名字;从第二行开始就是结点(node)之间的相互作用关系了;
(2) 数据至少包含两列,第一列是Source Node,第二列是Target Node;
就拿我们从STRING生成的网络图源文件为例,我们生成的是一个名为string_interactions.tsv的文件,这是一个文本文件,我们用Excel把它打开之后是这样子的:

导入文件怎么导入呢?打开Cytosacpe,找到 File-Import-Network from File 即可导入文件。

点击导入文件,找到你的网络源文件,也就是我们这里的 string_interactions.tsv 文件,导入之后是这样的,软件会自动帮我们识别最重要的两列:Source node和 Target node,一般就是前面两列,一般识别的都是对的。
如果识别的不对,很简单,点击一下表头,会有个下拉菜单,我们自己选择、自己指定就行。除了Source Node、Target Node,其他列数据的属性还包括Interaction Type、Edge Attribution、Source Attribution、Target Attribution 等,同时对应不同颜色和图标标记。

指定好数据列之后,点击OK即可,数据导入到此为止,软件会自动生成一个网络图。

页面布局
Cytoscape是一个非常庞大的软件,其功能非常丰富,页面布局也比较复杂,在我们导入了网络图数据之后呢,它会直接帮我们生成一个网络图,其页面如下:

由此可见,页面相当复杂,而其中我们最常用的区域就是两个:控制面板和网络图区。控制面板是我们用的最多的地方,这里面至少包括了三个子面板:
(1) Network: 网络图列表,这里以树形图的方式罗列了我们打开的所有网络图
(2) Style: 外观可视化控制面板,这个面板控制了我们的网络图外观,所有的外观设置都在这个里面,这个面板也包括了三个子面板:
a) Node: 控制节点的外观,包括大小、颜色、形状等,使用频率很高;
b) Edge: 控制连线的外观,包括颜色、粗细等,使用频率很高
c) Network: 控制网络图的外观,如背景色等,使用较少;

(3) Select: 筛选,即从整个网络图当中按照用户的要求去选定特Node或者Edge。这个功能用的也是比较多的。
整个Cytoscape页面布局中最重要的就是控制面板,而通过控制面板中特定属性的设置,我们就可以随心所欲地改变网络图的外观了。

应用商店
Cytoscape的菜单栏中有很多的功能栏,而我唯独要讲一讲这里面的 Apps 这一栏。Apps 就像我们手机上面的应用商城一样,提供了非常多的功能插件,它使得 Cytoscape 的功能根据用户的需求无限延伸,而且最重要的是,这里所有的插件都是免费的哦~,如下图所示:

后续我们筛选关键基因、进行功能富集都是在这个里面选取特定的插件实现的,所以Apps这个菜单栏也是极其重要的。
回到我们的研究课题当中,如何导入数据并实现高级的可视化操作呢?具体的步骤我这里就不一一罗列了,大家可以看文末的视频或者可以来参加我们近期的线下课程【线下·上海】实用生物信息与数据挖掘系列课程,到时候会手把手一步步地教大家怎么从一堆没有头绪的数据到一篇完整的SCI文章。
总之Cytoscape是一个非常庞大实用的软件,它里面隐藏了非常多的功能,建议大家有时间可以去阅读一下Cytoscape的官方说明。
到这里,我们的研究课题的三大步:
1、从基因列表到蛋白互作;(已完成)
2、从蛋白互作到互作网络;(已完成)
3、从互作网络到关键基因;
已经顺利完成前面两步了,下节教程我们讲解第三个步骤,如何从蛋白互作的网络锁定关键基因。
本期干货
Cytoscape实操详解
原文详情:“科研猫”公众号
科研猫原创系列,未经许可严禁转载,版权事宜由上海辰明律师事务所提供法务支持。