Weblogo |Seq logo 在線繪製工具
- 2019 年 10 月 8 日
- 筆記
seqlogo圖可以直觀清晰的反應序列偏好特徵,每個位置出現的鹼基或氨基酸類型反映了該位置序列的偏好性,每個字母的大小與該鹼基在該位置上的出現頻率成正相關。
這種表現方式對研究轉錄因子結合、RNA修飾等有重要指導意義,時常被應用到論文中。
上一篇推送介紹了關於如何利用R包繪製seqlogo圖,本文接著推薦一個在線繪製seqlogo的工具Weblogo.
Weblogo在線工具
WebLogo(http://weblogo.threeplusone.com)繪製seqlogo的老牌在線工具。相比於在R上繪製seqlogo圖,網頁版在線工具更加輕鬆容易。但同時也存在一定的局限性,就是不適合分析大批量數據。
結合上一篇《R包ggseqlogo繪製seq logo圖》推文,我們可以分別體驗在網頁繪製的輕鬆感,也可以體驗本地運行程式碼的快感。下面就來看一下WebLogo的使用:
Weblogo的首頁
用戶指南
網站中給出了用戶指南,裡面詳細介紹了上傳數據要求的格式、logo大小及顏色調整、輸出格式等。
在此列出需注意的幾項,更多詳情參見網頁:
- Sequence Data:上傳的文件格式要求為 CLUSTALW, FASTA, plain flatfile, MSF, NBRF, PIR, NEXUS和PHYLIP文件,其中要求每段序列的長度需保持一致
- Output format:最終結果可存儲PNG、JPEG、EPS、PDF、SVG格式 (矢量圖可用文章用圖的修改和排版(2)進一步修飾)
- Sequence Type:序列類型可以是蛋白序列、DNA、RNA
- Y軸的單位設定見下表
- logo字元顏色更改:支援更改既定的配色方案,更改顏色需使用指定的CSS2語法輸入顏色
- 具體參數見下文圖示
examples
Examples介面下展示了多個經典蛋白序列、核酸序列保守性logo圖,點擊Edit Logo可以查看這些例子的數據輸入格式及作圖時標題、橫縱坐標設定等參數,可以試著重新更改參數後看看效果。
Create——繪製自己的seqlogo
在Create介面選擇上傳數據文件或者直接輸入序列,調好各項圖片參數後即可得到logo圖!注意上面提到的數據格式要求,每一段序列要求相同的長度。而在R包中,除了可以輸入序列外還可以輸入PFM矩陣進行分析。
核酸序列的輸入格式
>aldB -18->4 attcgtgatagctgtcgtaaag >ansB 103->125 ttttgttacctgcctctaactt >araB1 109->131 aagtgtgacgccgtgcaaataa …...
蛋白序列的輸入格式
>Q9EXQ1/196-227 LTMT.-RGDIGNYLGLTVETISRLLGRFQKLGVL >Q46158/72-92 LTMT.-RGDIGNYLGLTVETISR----------- >Q46157/72-92 LTMT.-RGDIGNYLGLTVETISR----------- >Q46159/72-92 LTMT.-RGDIGNYLGLTVETISR----------- >Q47948/72-92 LTMT.-RGDIGNYLGLTVETISR----------- >FNR_HAEIN/196-227 LTMT.-RGDIGNYLGLTVETISRLLGRFQKLGVI >ETRA_SHEPU/193-224 LTMT.-RGDIGNYLGLTVETISRLLGRFQKSGLI ……
顏色更改及其它參數
可以在下面Color scheme指定自定義配色方案,在左邊指定顏色,右邊指定相關符號,使用CSS2語法輸入顏色。這樣我們就給seqlogo圖換了一身衣服~ (Version fineprint勾掉後就會隱去右下角的WebLogo水印,用完別忘記引用哦)