Weblogo |Seq logo 在線繪製工具

  • 2019 年 10 月 8 日
  • 筆記

seqlogo圖可以直觀清晰的反應序列偏好特徵,每個位置出現的鹼基或氨基酸類型反映了該位置序列的偏好性,每個字母的大小與該鹼基在該位置上的出現頻率成正相關。

這種表現方式對研究轉錄因子結合、RNA修飾等有重要指導意義,時常被應用到論文中。

上一篇推送介紹了關於如何利用R包繪製seqlogo圖,本文接著推薦一個在線繪製seqlogo的工具Weblogo.

Weblogo在線工具

WebLogo(http://weblogo.threeplusone.com)繪製seqlogo的老牌在線工具。相比於在R上繪製seqlogo圖,網頁版在線工具更加輕鬆容易。但同時也存在一定的局限性,就是不適合分析大批量數據。

結合上一篇《R包ggseqlogo繪製seq logo圖》推文,我們可以分別體驗在網頁繪製的輕鬆感,也可以體驗本地運行程式碼的快感。下面就來看一下WebLogo的使用:

Weblogo的首頁

用戶指南

網站中給出了用戶指南,裡面詳細介紹了上傳數據要求的格式、logo大小及顏色調整、輸出格式等。

在此列出需注意的幾項,更多詳情參見網頁:

  • Sequence Data:上傳的文件格式要求為 CLUSTALW, FASTA, plain flatfile, MSF, NBRF, PIR, NEXUS和PHYLIP文件,其中要求每段序列的長度需保持一致
  • Output format:最終結果可存儲PNG、JPEG、EPS、PDF、SVG格式 (矢量圖可用文章用圖的修改和排版(2)進一步修飾)
  • Sequence Type:序列類型可以是蛋白序列、DNA、RNA
  • Y軸的單位設定見下表
  • logo字元顏色更改:支援更改既定的配色方案,更改顏色需使用指定的CSS2語法輸入顏色
  • 具體參數見下文圖示

examples

Examples介面下展示了多個經典蛋白序列、核酸序列保守性logo圖,點擊Edit Logo可以查看這些例子的數據輸入格式及作圖時標題、橫縱坐標設定等參數,可以試著重新更改參數後看看效果。

Create——繪製自己的seqlogo

在Create介面選擇上傳數據文件或者直接輸入序列,調好各項圖片參數後即可得到logo圖!注意上面提到的數據格式要求,每一段序列要求相同的長度。而在R包中,除了可以輸入序列外還可以輸入PFM矩陣進行分析。

核酸序列的輸入格式

>aldB -18->4  attcgtgatagctgtcgtaaag  >ansB 103->125  ttttgttacctgcctctaactt  >araB1 109->131  aagtgtgacgccgtgcaaataa  …...

蛋白序列的輸入格式

>Q9EXQ1/196-227  LTMT.-RGDIGNYLGLTVETISRLLGRFQKLGVL  >Q46158/72-92  LTMT.-RGDIGNYLGLTVETISR-----------  >Q46157/72-92  LTMT.-RGDIGNYLGLTVETISR-----------  >Q46159/72-92  LTMT.-RGDIGNYLGLTVETISR-----------  >Q47948/72-92  LTMT.-RGDIGNYLGLTVETISR-----------  >FNR_HAEIN/196-227  LTMT.-RGDIGNYLGLTVETISRLLGRFQKLGVI  >ETRA_SHEPU/193-224  LTMT.-RGDIGNYLGLTVETISRLLGRFQKSGLI  ……

顏色更改及其它參數

可以在下面Color scheme指定自定義配色方案,在左邊指定顏色,右邊指定相關符號,使用CSS2語法輸入顏色。這樣我們就給seqlogo圖換了一身衣服~ (Version fineprint勾掉後就會隱去右下角的WebLogo水印,用完別忘記引用哦)