DamID-seq分析筆記(一)
- 2020 年 4 月 9 日
- 筆記
pre: 盡量寫詳細點,方便理解
1: illumia機器測序的方向是3—->5,附上一張圖:

image.png
我是PE150測序,測序的adapter :GATCG GAAGA 拿到數據的第一眼,先看一下測序的情況,我先打開一個fq的文件先看看:
cat XXX_R1.fq | grep GATCGGAAGA
illumia機器測序的方向是3-5,從這個情況來看,trim之後的有些reads長度會短一些。

但是因為在加接頭之前需要加A,再加接頭,我們把這個鹼基往前挪去A去看,然後就可以發現都序列特徵是AG
這個是DamID-seq的數據 我們需要知道,DamID是利用Dam和DpnI來工作的,DpnI的位點是G(me)ATC :

結合3—>5的illumia的測序,我們知道,有AG開頭的reads是我們要的reads.

(PS:記得在Adapter 後面加個A) 數據處理思路 1:先用cutadapt去掉接頭 然後跑一個fastqc看一些結果,如果鹼基品質很好的話,可以不用trim,如果鹼基品質不夠好還是需要trim的
cutadapt -a ADAPTER_FWD -o out.1.fastq -p out.2.fastq reads.1.fastq reads.2.fastq
2(可選):trimmomatic
java -jar /asnas/sunyl_group/liull/software/Trimmomatic-0.36/trimmomatic-0.36. jar PE Reads_R1. fq.gz Reads_R2.fq.gz reads_R1.trimmo.fq unpair_1.trimo.fq reads_R2.trimmo.fq unpair_2.trimo.fq LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:51

那麼好,接下來把接頭給去了,並且去掉一些低品質的數據: 接下來就是mapping 到基因組上
總結一下: 利用cutadapter去了接頭 trimmomatic去了低品質數據(可選) fastqc看結果

下一步:mapping