NEWS
新聞資訊
|
ChIP/ATAC/CUT/DAP必看——*Peak到底怎么來的在分子生物學(xué)研究中,識(shí)別和分析基因組范圍內(nèi)的調(diào)控元素是理解基因表達(dá)調(diào)控機(jī)制的關(guān)鍵。隨著高通量測序技術(shù)的不斷進(jìn)步,諸如ChIP-seq、ATAC-seq、CUT&Tag和DAP-seq等技術(shù)為我們提供了強(qiáng)大的工具,以揭示轉(zhuǎn)錄因子結(jié)合位點(diǎn)、開放染色質(zhì)區(qū)域和DNA結(jié)合蛋白的相互作用等信息。在這些實(shí)驗(yàn)數(shù)據(jù)中,我們常常接觸到“peak/差異Peak”的概念。從分析邏輯上來說Peak究竟是如何產(chǎn)生的?本文將探討這些問題背后的分析邏輯,主要圍繞以下四個(gè)問題幫助大家更好地理解這些高通量數(shù)據(jù)的分析結(jié)果。
Q1: merge peak 和合并組peak是什么,計(jì)算邏輯以及差異是什么? A1: 首先我們來解釋下什么是peak,peak(峰)是指在基因組中發(fā)現(xiàn)的特定區(qū)域,這些區(qū)域顯示出顯著的信號(hào)強(qiáng)度,通常與轉(zhuǎn)錄因子結(jié)合或其他蛋白質(zhì)-DNA相互作用相關(guān)。表觀組學(xué)的研究一般會(huì)同組設(shè)計(jì)2~3個(gè)重復(fù),MACS2軟件(圖1)進(jìn)行call peak時(shí),會(huì)基于reads進(jìn)行建模以及均一化(方便IN和IP之間具有可比性),隨后利用泊松分布計(jì)算顯著性p值后,利用預(yù)先設(shè)置的顯著性閾值輸出peak結(jié)果文件(圖1)。除了單樣本IP VS IN的call peak,當(dāng)組內(nèi)有生物學(xué)重復(fù)時(shí),MACS也能整合組內(nèi)重復(fù)數(shù)據(jù)輸出“以組為單位的peak結(jié)果”(圖2)。除了MACS自身分析的“組peak”外,我們還會(huì)人為對(duì)組內(nèi)生物學(xué)重復(fù)peak進(jìn)行merge peak分析,得到以第二種方式分析的“組的peak”,分析邏輯如圖3。
圖 1 MACS2分析流程
圖 2 “合并組peak”的分析邏輯
圖 3 merge peak示意圖 Q2: diff peak計(jì)算邏輯? A2:差異peak就是要涉及到組間比較了,通常使用的分析軟件是DiffBind分析包。該軟件會(huì)對(duì)兩個(gè)不同組樣品進(jìn)行差異分析,計(jì)算peaks重復(fù)間隔的測序reads數(shù),并基于結(jié)合親和力鑒定具有統(tǒng)計(jì)顯著性的差異結(jié)合位點(diǎn),確定樣品間上調(diào)或下調(diào)差異修飾的區(qū)間。分析思路采用了RNA-seq中差異基因表達(dá)的方式來進(jìn)行peak的差異分析,和macs2的差異功能(bdgdiff)不同,DiffBind需要依賴已有的peak calling結(jié)果,將peak區(qū)域當(dāng)做RNA-seq中的基因區(qū)域,然后對(duì)這些區(qū)域進(jìn)行定量和差異分析,其核心的差異分析通過調(diào)用RNA-seq中常用的R包來實(shí)現(xiàn)。通常默認(rèn)的模型是DESeq2。這就意味著如果要用DiffBind進(jìn)行差異分析的話,必須要有重復(fù)樣本,否則行不通。 除了直接使用DiffBind軟件計(jì)算組間差異,還可以順著merge peak的位置信息,通過取交集的方式分析兩組樣本間的差異。 Q3: diff peak的結(jié)果文件怎么看?Up / down代表什么? A3: Diff_anotation注釋表格(圖4)是整個(gè)差異組比較中最核心的部分:“Treat_vs_CK.merge_peak_down.peak_annotation”是利用組內(nèi)重復(fù)merge取交集后的peak再按照peak位置關(guān)系做組間比較,得到Treat與CK相比較只在CK中有富集的峰;“Treat_vs_CK.merge_peak_up.peak_annotation”是利用組內(nèi)重復(fù)merge取交集后的peak再按照peak位置關(guān)系做組間比較,得到Treat與CK相比較只在Treat中有富集的峰; 以上merge之間peak的比較只有有無的區(qū)別,沒有顯著性的統(tǒng)計(jì)學(xué)計(jì)算。 “Treat_vs_CK.down.peak_annotation”是利用DiffBind軟件(默認(rèn)是內(nèi)置DESeq2邏輯)分析組間peak差異,與merge_peak分析不同,該軟件包會(huì)進(jìn)行統(tǒng)計(jì)學(xué)顯著性的計(jì)算,并對(duì)富集倍率有一定要求,默認(rèn)閾值為FDR值小于0.05,并且Fold(log2FC)小于0。分析結(jié)果包含F(xiàn)old、p.value、FDR、關(guān)聯(lián)靶基因等,如圖5。down是指Treat與CK相比較,在Treat中富集倍率降低的peak區(qū)域。 “Treat_vs_CK.up.peak_annotation”同樣也是利用DiffBind軟件分析的,是指Treat與CK相比較,在Treat中富集倍率升高的peak區(qū)域。 “Treat_vs_CK.mid”是樣本間所有差異的Peak的文件,老師們可以利用這個(gè)文件結(jié)果,自主利用閾值篩選;“Treat_vs_CK.nofilt”同樣也是樣本間所有差異的Peak的文件,只不過包含了注釋信息。 兩種比較方案有不同的側(cè)重點(diǎn),merge diff側(cè)重于分析A組相對(duì)于B組的“特有peak”,而diffbind則傾向于分析兩組間固定區(qū)域的結(jié)合強(qiáng)度差異(FOLD)。因此,兩個(gè)差異方案結(jié)合,能從不同角度探究組間差異,老師可自行按照自身關(guān)注點(diǎn)來選擇以哪種結(jié)果進(jìn)行后續(xù)研究。
圖 4 Diff_anotation文件
圖 5 軟件分析表格結(jié)果 Q4: 無重復(fù)單樣本組間比較和多重復(fù)樣本組間比較的邏輯差異 A4: 對(duì)于多重復(fù)樣本差異分析可以參考上述A3中的DiffBind軟件包或者先取組內(nèi)交集merge再做組間比較;而對(duì)于單樣本的組間比較就沒有那么多選擇了,只能通過peak位置判斷差異,取兩組間非交集的peak區(qū)域。 上述所有的分析內(nèi)容,在愛基的ChIP-seq、ATAC-seq、CUT&Tag和DAP-seq項(xiàng)目中都可以分析哦,依據(jù)分析出來的peak愛基還可以提供指定的基因/peak的reads富集峰圖,歡迎各位有相關(guān)需求的老師前來咨詢~
項(xiàng)目咨詢 愛基百客王牌產(chǎn)品 ChIP-seq技術(shù)將染色質(zhì)免疫共沉淀和二代測序技術(shù)結(jié)合,是研究體內(nèi)蛋白質(zhì)與DNA相互作用的有力工具,可用于組蛋白修飾、RNA聚合酶、轉(zhuǎn)錄因子和輔因子以及G4鏈體(G4)等方面的研究,技術(shù)成熟穩(wěn)定。愛基百客ChIP-seq可提供: ChIP-seq測序分析 Peak分析:Peak注釋和分布分析,Peak關(guān)聯(lián)基因的GO、KEGG的注釋和富集分析,轉(zhuǎn)錄因子和Motif分析等。 多樣本差異分析:差異Peak分布情況統(tǒng)計(jì),差異Peak關(guān)聯(lián)基因GO、KEGG功能注釋與富集,轉(zhuǎn)錄因子預(yù)測,Motif預(yù)測等。 后續(xù)驗(yàn)證 · ChIP-qPCR 分析組蛋白修飾/轉(zhuǎn)錄因子與染色質(zhì)區(qū)域的結(jié)合情況,揭示染色質(zhì)狀態(tài)和基因表達(dá)調(diào)控之間的關(guān)系,真實(shí)反映結(jié)合特性。 · EMSA 基于DNA-蛋白質(zhì)復(fù)合體在聚丙烯酰胺凝膠電泳(PAGE)中的遷移率不同,檢測活化的與DNA結(jié)合的蛋白轉(zhuǎn)錄或調(diào)節(jié)因子。 · 雙熒光素酶報(bào)告實(shí)驗(yàn) 檢測轉(zhuǎn)錄因子與靶啟動(dòng)子的特異結(jié)合。 ChIP-seq+轉(zhuǎn)錄組關(guān)聯(lián)分析 ChIP-seq和轉(zhuǎn)錄組關(guān)聯(lián)分析可以做以下2個(gè)方面的研究 · DNA結(jié)合蛋白和基因表達(dá)調(diào)控: 通過ChIP-seq技術(shù)可以確定DNA結(jié)合蛋白(如轉(zhuǎn)錄因子)的結(jié)合位點(diǎn),然后與轉(zhuǎn)錄組數(shù)據(jù)結(jié)合分析,可以獲得轉(zhuǎn)錄因子直接調(diào)控的靶基因,為全面理解轉(zhuǎn)錄因子調(diào)控功能提供依據(jù)。 · 組蛋白修飾和基因表達(dá): ChIP-seq可以用于鑒定組蛋白修飾的位點(diǎn),結(jié)合轉(zhuǎn)錄組數(shù)據(jù)可以了解這些修飾對(duì)基因表達(dá)的影響。 愛基百客ChIP-seq三大優(yōu)勢 · 優(yōu)勢一: 項(xiàng)目經(jīng)驗(yàn)豐富,研究物種200+種,累計(jì)實(shí)驗(yàn)2000余次。全面覆蓋醫(yī)口和農(nóng)口等不同樣本,不懼特殊樣本(如脂肪組織、高淀粉組織和真菌類),抗體經(jīng)驗(yàn)也極其豐富(多種組蛋白修飾、轉(zhuǎn)錄因子、標(biāo)簽抗體以及p300和RNApol II等均有涉及); · 優(yōu)勢二: 提供前期實(shí)驗(yàn)設(shè)計(jì)、測序、分析以及后期驗(yàn)證(ChIP-qPCR、EMSA)一站式服務(wù); · 優(yōu)勢三: 項(xiàng)目文章多次發(fā)表于Science、Cancer Cell、Nature Plants、Nature Metabolism以及Plant Cell等期刊。
Zhang, Y., Liu, T., Meyer, C. A., Eeckhoute, J., Johnson, D. S., Bernstein, B. E., Nusbaum, C., Myers, R. M., Brown, M., Li, W., & Liu, X. S. (2008). Model-based analysis of ChIP-Seq (MACS). Genome biology, 9(9), R137. https://doi.org/10.1186/gb-2008-9-9-r137 Stark, R., & Brown, G. (2011). DiffBind: differential binding analysis of ChIP-Seq peak data. R package version, 100, 4-3
了 解 更 多 { 往 期 精 彩 回 顧 } 精選合集,歡迎收藏喲!
|








