多組學(xué)(表觀組+轉(zhuǎn)錄組+微生物組)關(guān)聯(lián)分析及組學(xué)分子實(shí)驗(yàn)驗(yàn)證方法
瀏覽次數(shù):1766 發(fā)布日期:2023-5-16
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
生物過程具有復(fù)雜性和整體性,單組學(xué)數(shù)據(jù)難以系統(tǒng)全面解析復(fù)雜生理過程的分子調(diào)控機(jī)制。而多組學(xué)(Multi-omics)聯(lián)合分析可同時(shí)實(shí)現(xiàn)從“因”和“果”兩個(gè)層面研究生物學(xué)問題,并對其相關(guān)性進(jìn)行驗(yàn)證。高通量技術(shù)的發(fā)展,通過對多組學(xué)數(shù)據(jù)整合分析,已成為科學(xué)家探索生命機(jī)制的新方向。
多組學(xué)研究是探究生物系統(tǒng)中多種物質(zhì)之間互作的方法,包括基因組學(xué)、表觀基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、微生物組學(xué)等,這些物質(zhì)共同影響生命系統(tǒng)的表型、性狀等。
什么是多組學(xué)關(guān)聯(lián)分析?
關(guān)聯(lián)分析是一種實(shí)用的分析技術(shù),就是發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而描述一個(gè)事物中某些屬性同時(shí)變化的規(guī)律和模式。
需要特別注意的是:相關(guān) ≠ 因果;相關(guān) ≠ 必然
因果關(guān)系的論證一般需要嚴(yán)密的分子實(shí)驗(yàn)。

圖示:分子的相互作用,產(chǎn)生關(guān)聯(lián)
組學(xué)技術(shù)及其關(guān)聯(lián)性
不同組學(xué)
① 表觀組(差異表觀分子特征):甲基化、組蛋白修飾、開放染色質(zhì)區(qū)、lncRNA、circleRNA、miRNA... ...
② 轉(zhuǎn)錄組(差異基因表達(dá)):mRNA
③ 蛋白組(差異蛋白):蛋白質(zhì)
④ 代謝組(差異代謝物):代謝物
⑤ 微生物組(差異菌群):菌群結(jié)構(gòu)
多組學(xué)關(guān)聯(lián)的意義:串聯(lián)證據(jù),互相驗(yàn)證,從不同的角度合力探索和解釋生物學(xué)問題
判斷組學(xué)之間是否可以進(jìn)行關(guān)聯(lián):是否有關(guān)聯(lián)的生物學(xué)理論基礎(chǔ)。
如:
• 啟動子區(qū)甲基化會抑制基因的表達(dá)。
• 基因主體甲基化與基因表達(dá)正相關(guān)。
• 開放染色質(zhì)狀態(tài)與基因表達(dá)有關(guān)。
• 蛋白質(zhì)是mRNA翻譯的產(chǎn)物。
• miRNA可與mRNA相互作用影響其表達(dá)和翻譯
關(guān)聯(lián)分析的主要套路
基于參考文獻(xiàn)和數(shù)據(jù)庫:項(xiàng)目異質(zhì)性強(qiáng),Case by Case 模式
基于代謝通路等已知數(shù)據(jù)庫:高度依賴已知代謝網(wǎng)絡(luò)解讀深度,無法探索未知
基于統(tǒng)計(jì)學(xué):數(shù)據(jù)最樸質(zhì)的結(jié)構(gòu)特征解析,可以獲取未知信息,甚至可以為拓展新的知識體系提供幫助
圖示:實(shí)際應(yīng)用中往往三管齊下
易基因主要表觀組學(xué)技術(shù)分類
- DNA甲基化/羥甲基化位點(diǎn)/區(qū)域
- RNA甲基化位點(diǎn)/區(qū)域
- 轉(zhuǎn)錄因子結(jié)合區(qū)、組蛋白結(jié)合區(qū)
- DNase超敏位點(diǎn)、開放染色質(zhì)區(qū)
圖示:易基因組學(xué)技術(shù)研究內(nèi)容
多組學(xué)關(guān)聯(lián)分析方法
(1) 直接關(guān)聯(lián)
一個(gè)基因的功能元件甲基化情況影響該基因的表達(dá)。
• 重疊分析
• Pearson/Spearman 相關(guān)性分析
(2)模型關(guān)聯(lián)
基于基因轉(zhuǎn)錄、蛋白質(zhì)、代謝物等之間的上下游相互作用聯(lián)系。
• 多元線性模型(multiple linear model)
(3)網(wǎng)絡(luò)關(guān)聯(lián)
基于分子功能和通路的富集性。
• WGCNA module correlation
• EMDN algorithm
• SNF algorithm
多組學(xué)關(guān)聯(lián)分析方法圖例
(1)直接關(guān)聯(lián)
① 重疊分析
特點(diǎn):簡單粗暴,也適用于樣本量少的情況。
分析結(jié)果:韋恩圖。
圖例:WGBS + total RNA-seq,含DMR的差異表達(dá)基因、差異miRNA靶向的差異表達(dá)基因、差異siRNA靶向的差異表達(dá)基因三者之間的重疊關(guān)系分析
關(guān)聯(lián)理論基礎(chǔ):DNA甲基化、miRNA和siRNA協(xié)同作用調(diào)控基因表達(dá)。
② 皮爾森/斯皮爾曼相關(guān)性分析
特點(diǎn):準(zhǔn)確計(jì)算相關(guān)性程度(R值),及其顯著性(p值)。
分析結(jié)果:散點(diǎn)圖(+擬合線)、相關(guān)性熱圖
圖例:血液組織RRBS+RNA-seq,DMR的甲基化水平與差異表達(dá)的表達(dá)水平之間的皮爾森關(guān)聯(lián)分析。
關(guān)聯(lián)理論基礎(chǔ):DNA甲基化可直接調(diào)控基因表達(dá)。
圖例:腸道宏基因組+宏病毒組,健康與炎癥性腸。║C)組分別計(jì)算噬菌體與細(xì)菌豐度之間的皮爾森相關(guān)性并發(fā)現(xiàn)差異。
關(guān)聯(lián)理論基礎(chǔ):噬菌體可侵染細(xì)菌進(jìn)而影響腸道菌群的結(jié)構(gòu)。
圖例:胚胎scRNA-seq+蛋白質(zhì)組,兩連續(xù)發(fā)育階段之間的RNA和表蛋白質(zhì)表達(dá)的相關(guān)性分析。
關(guān)聯(lián)理論基礎(chǔ):RNA轉(zhuǎn)錄和蛋白質(zhì)翻譯具有上下游關(guān)系。

圖例:腸道宏基因組+代謝組,不同管理狀態(tài)下川金絲猴腸道中短鏈脂肪酸與腸道菌群的皮爾森相關(guān)性分析。
關(guān)聯(lián)理論基礎(chǔ):腸道中有多類菌群可直接產(chǎn)生短鏈脂肪酸這類益生物質(zhì)。
(2)模型關(guān)聯(lián)
回歸分析(regression analysis)是確定兩組或兩組以上變量間關(guān)系的統(tǒng)計(jì)方法。回歸分析按照變量的數(shù)量分為一元回歸和多元回歸。兩個(gè)變量使用一元回歸,兩個(gè)以上變量使用多元回歸。
多元線性回歸模型(multiple linear model)
特點(diǎn):基于基因表達(dá)、蛋白質(zhì)、代謝物等之間的直接和間接相互作用聯(lián)系。
分析結(jié)果:關(guān)聯(lián)網(wǎng)絡(luò)圖
圖例:腸道菌群16S+血液代謝組+肝臟轉(zhuǎn)錄組,通過多元線性模型關(guān)聯(lián)分析,篩選出若干優(yōu)秀模型,組建低劑量抗生素飼喂促進(jìn)仔豬快速生長的多組學(xué)調(diào)控網(wǎng)絡(luò)。
關(guān)聯(lián)理論基礎(chǔ):腸道菌群可通過產(chǎn)生代謝物進(jìn)入血液,運(yùn)輸至肝臟影響肝臟細(xì)胞的基因表達(dá)。
(3)網(wǎng)絡(luò)關(guān)聯(lián)
細(xì)胞內(nèi)所有大分子相互作用的集合,稱為相互作用組(Interactome),是大多數(shù)基因型與表型關(guān)系的基礎(chǔ),可以用來指導(dǎo)解釋組學(xué)技術(shù)檢測到的變化如何干擾整個(gè)機(jī)體。
機(jī)體的分子響應(yīng)和變化具有功能富集性、通路富集性。因此不同組學(xué)檢測數(shù)據(jù)也具有相似的功能富集性和變化規(guī)律。
網(wǎng)絡(luò)關(guān)聯(lián)算法正是基于這些生物學(xué)理論基礎(chǔ)。
- 基于WGCNA的共變關(guān)聯(lián)網(wǎng)絡(luò)分析(WGCNA module correlation)
- 基于表觀模塊的差異網(wǎng)絡(luò)分析(EMDN algorithm)
- 相似性網(wǎng)絡(luò)融合分析(SNF algorithm)
分析結(jié)果:關(guān)聯(lián)網(wǎng)絡(luò)圖
- ①基于WGCNA的共變關(guān)聯(lián)網(wǎng)絡(luò)分析
- 利用組間差異基因鑒定共甲基化和共表達(dá)模塊。
- 模塊-模塊相關(guān)性、模塊表型相關(guān)性可以有效識別具有功能富集性的多組學(xué)變化模塊。
圖例:血液組織RRBS + RNA-seq,基因的差異甲基化模式與基因表達(dá)模式的共變關(guān)聯(lián)網(wǎng)絡(luò)分析。
- 前期直接關(guān)聯(lián)得到的基因很少;
- 改變策略,采用基于WGCNA的共變關(guān)聯(lián)網(wǎng)絡(luò)分析,得到的共甲基化和共表達(dá)基因均富集于自噬相關(guān)通路。
關(guān)聯(lián)理論基礎(chǔ):基因組DNA的甲基化與基因表達(dá)變化具有功能富集性。
圖例:腸道宏基因組+代謝組,不同管理狀態(tài)下川金絲猴糞便代謝物與腸道菌群基于WGCNA的共變關(guān)聯(lián)網(wǎng)絡(luò)分析。
- 鑒定了2對強(qiáng)正相關(guān)的物種和代謝物的共變化模塊。
- 圈養(yǎng)條件的代表性模塊中發(fā)現(xiàn)了潛在致病菌和相關(guān)代謝物。
關(guān)聯(lián)理論基礎(chǔ):腸道菌群可響應(yīng)環(huán)境變化改變腸道微環(huán)境中相關(guān)的代謝產(chǎn)物的濃度。
- 基于表觀模塊的差異網(wǎng)絡(luò)分析(EMDN algorithm)
- 利用組間差異基因鑒定共甲基化(共表達(dá))模塊。
- 差異共甲基化(差異共表達(dá))網(wǎng)絡(luò)篩選。
- 從多個(gè)差異共變網(wǎng)絡(luò)中篩選共同網(wǎng)絡(luò)。
圖例:基于表觀模塊的差異網(wǎng)絡(luò)分析(EMDN algorithm)
- 相似性網(wǎng)絡(luò)融合分析 (SNF algorithm)
圖例:
- SNF算法(圖1d)使用了一種基于信息傳遞理論的非線性算法,該方法迭代更新每個(gè)網(wǎng)絡(luò),使其與其他網(wǎng)絡(luò)更加相似。經(jīng)過幾次迭代之后,SNF收斂到單個(gè)網(wǎng)絡(luò)中。
- 算法的優(yōu)點(diǎn)是,弱相似性(低權(quán)重的邊)消失,有助于降低噪聲,而在一個(gè)或多個(gè)網(wǎng)絡(luò)中存在的強(qiáng)相似性(高權(quán)重的邊)被添加到其他網(wǎng)絡(luò)中。
圖例:融合網(wǎng)絡(luò)三個(gè)cluster內(nèi)部的連接性、緊密性和cluster之間相對較少的邊界,說明該算法可以更清晰地顯示多形性成膠質(zhì)細(xì)胞瘤(GBM)患者的分型情況。
- 其他網(wǎng)絡(luò)關(guān)聯(lián)分析方法

從關(guān)聯(lián)走向因果:組學(xué)分子實(shí)驗(yàn)驗(yàn)證
基因表達(dá)相關(guān)的組學(xué):
甲基化組學(xué):
宏基因組(腸道菌群):
以上是關(guān)于多組學(xué)分析方法及組學(xué)分子實(shí)驗(yàn)驗(yàn)證的解析。
參考文獻(xiàn):
Yan H, Bombarely A, Xu B, et al.Autopolyploidization in switchgrass alters phenotype and flowering time viaepigenetic and tranion regulation[J]. Journal of experimental botany,2019
Zhang, D., Hu, Q., … Gao, F. (2019). Epigenetic and transcriptional signatures of ex situ conserved golden snub-nosed monkeys (Rhinopithecus roxellana). Biological Conservation, 237, 175–184.
Zuo, T., Lu, X. J., Zhang, Y. (2019). Gut mucosal virome alterations in ulcerative colitis. Gut, 68(7), 1169–1179.
Gao, Y., Liu, X.. (2017). Protein Expression Landscape of Mouse Embryos during Pre-implantation Development. Cell Reports, 21(13), 3957–3969.
Evaluating the influence of conservation activities on the gut microecosystem of Rhinopithecus roxellana based on establishment of a gut microbiome gene catalog. Unpublished.
Inter-correlated gut microbiota and SCFAs changes upon antibiotics exposure links with rapid body-mass gain in weaned piglet model. The Journal of nutritional biochemistry,2019, 74: 108246.
Multiple network algorithm for epigenetic modules via the integration of genome-wide DNA methylation and gene expression data. BMC Bioinformatics , 2017,18(1), 1–13.
Similarity network fusion for aggregating data types on a genomic scale. Nature Methods , 2014,11(3), 333–337.
Di Nanni, N., Bersanelli, M.(2020). Network Diffusion Promotes the Integrative Analysis of Multiple Omics. Frontiers in Genetics,11(February), 1–12.