在不適合或不需要使用全基因組測序的情況下,外顯子組測序不失為一種高性價(jià)比的方法。它只對基因組的編碼區(qū)域進(jìn)行測序,這樣便將資源集中到最可能會影響表型的基因,因此能夠一舉為您縮短周轉(zhuǎn)時(shí)間和節(jié)約成本。在檢測編碼外顯子中的變異時(shí),外顯子組測序能夠?qū)邢騼?nèi)容擴(kuò)大到非翻譯區(qū)(UTR)和microRNA,從而提供一個(gè)更全面的基因調(diào)控視野。僅需一天便能制備DNA文庫,而且每個(gè)外顯子組僅需測序4–5 Gb即可。
全外顯子組測序?qū)嶒?yàn)流程
SureSelect 人全外顯子 V6 高度優(yōu)化的捕獲探針設(shè)計(jì)結(jié)合嚴(yán)格的捕獲工作流程,獲得的高的在靶效率能夠確保讀出序列對靶標(biāo)的特異性映射,從而實(shí)現(xiàn)深度覆蓋。此外顯子組靶向包括難捕獲區(qū)域的相關(guān)數(shù)據(jù)庫的更新內(nèi)容,可實(shí)現(xiàn)蛋白質(zhì)編碼區(qū)域的全面分析。
樣品要求
數(shù)據(jù)分析
1. 標(biāo)準(zhǔn)分析:原始數(shù)據(jù)基本分析、序列比對、SNP檢測等。
a) 基本信息分析:按Illumina 標(biāo)準(zhǔn)流程進(jìn)行base calling、raw data 數(shù)據(jù)整理及數(shù)據(jù)質(zhì)量評估;
b) 數(shù)據(jù)通過GATK, SAMtools 等檢測SNP 和InDel 變異信息;
c) 將SNP 和InDel 與最新發(fā)布的dbSNP 和千人基因組數(shù)據(jù)進(jìn)行比對分析;
d) 變異所在基因的功能注釋;
e) 多樣本分析。
2. 高級信息分析:孟德爾遺傳疾病分析、復(fù)雜疾病分析、腫瘤癌癥分析等。
全外顯子組技術(shù)方案優(yōu)勢
1. 最全面的內(nèi)容,適用于任何應(yīng)用的外顯子組解決方案
- 包含相關(guān)數(shù)據(jù)庫的最新核心內(nèi)容,可靶向包括難捕獲區(qū)域在內(nèi)的更多外顯子
- 輕松添加用于轉(zhuǎn)化研究的 UTR、用于癌癥研究的 COSMIC,或用于特定應(yīng)用的定制內(nèi)容
2. 高覆蓋率、高深度測序,可準(zhǔn)確的檢測出疾病相關(guān)的常見及稀有變異
- 建議測序深度
- Germline變異相關(guān)建議測序深度80X以上(單基因/復(fù)雜疾病研究)
- Somatic變異相關(guān)建議測序深度150X以上(腫瘤癌癥研究)
二、WES研究方案 — 基于全外顯子組測序的孟德爾遺傳疾病研究方案

孟德爾遺傳病,也稱單
基因遺傳病,是指受一對
等位基因(主效基因)控制的遺傳性疾病。孟德爾遺傳病是新生兒出生缺陷的重要原因之一,目前全球已知的單基因遺傳病大約7000多種,而且其中大部分的潛在疾病基因還尚未研究清楚。
傳統(tǒng)孟德爾疾病基因的識別主要是通過對候選基因?qū)嵤㏒anger測序而確定。候選基因的確定主要是通過一些基因組區(qū)域的位置映射方法,如核型分析,連鎖分析等。然而,這種方法不能確定疾病是由某個(gè)單核苷酸突變導(dǎo)致還是基因組結(jié)構(gòu)變異導(dǎo)致。隨著二代測序技術(shù)的發(fā)展,尤其是外顯子測序技術(shù)的出現(xiàn),使得基因組以及基因組蛋白質(zhì)編碼區(qū)的常見及罕見變異都能被準(zhǔn)確檢測到,極大地促進(jìn)疾病基因的識別。
研究目的
² 鑒定孟德爾遺傳疾病中的致病位點(diǎn)
樣本準(zhǔn)備
² 家系樣本:患病個(gè)體及核心家系成員(系譜圖、臨床表型、年齡)
² 測序深度建議:≥ 80X
² 遺傳模式:常染色體顯性遺傳(AD);常染色體隱性遺傳(AR);伴性遺傳
生物信息分析路線
三、WES研究方案 — 基于全外顯子組測序的復(fù)雜疾病研究方案
由多個(gè)基因及環(huán)境因素相互作用所致的疾病,如心血管疾病、二型糖尿病、原發(fā)性高血壓、銀屑病等,稱為復(fù)雜疾。╟omplex disease)或多基因。╬olygenic disease)。這類疾病發(fā)病率一般都超過0.001,在臨床或流行病學(xué)方面具有一定程度的家族傾向,但又不表現(xiàn)典型的孟德爾遺傳方式。復(fù)雜疾病是一種受多基因、多因子影響的疾病,包括遺傳因素、環(huán)境因素與其它因素。一般認(rèn)為微效作用模式在復(fù)雜疾病的發(fā)生機(jī)制中起主要作用,即來自多個(gè)位點(diǎn)的大多數(shù)風(fēng)險(xiǎn)基因在群體中的發(fā)生頻率都很低,它們之間有相互作用,通過數(shù)量性狀的劑量效應(yīng)關(guān)系,達(dá)到疾病發(fā)生的臨界域值,而共同決定了復(fù)雜疾病的遺傳易感性。
研究目的
² 探索復(fù)雜疾病的致病機(jī)制,尋找與疾病顯著相關(guān)的致病和易感位點(diǎn)。
研究方法
進(jìn)行復(fù)雜疾病的研究需要具備兩個(gè)條件,一是要有遺傳背景一致或相似的資源群體;二是要有覆蓋全基因組的高密度的標(biāo)記。利用和全外顯子組測序,我們可在全外顯子組范圍內(nèi)獲取大量的準(zhǔn)確性高的變異位點(diǎn)。
復(fù)雜疾病遺傳變異的研究依據(jù)研究對象不同的遺傳背景來源,分為基于家系和基于散發(fā)人群兩種研究策略。目前常規(guī)的分析方法如下圖所示:
樣本準(zhǔn)備
- Case-control散發(fā)樣本:疾病患者與正常對照樣本的外周血DNA。Case樣本數(shù)建議>200; control樣本數(shù)建議>200。樣本來源保持地域一致,例如:少數(shù)名族與漢族的分開。疾病分組若 按亞型來分,每種 亞型建議樣本數(shù)>100。
- 家系樣本:患病個(gè)體及核心家系成員(系譜圖、個(gè)體表型、年齡)。
- 測序深度建議:≥ 80X。
生物信息分析路線

四、WES研究方案 —基于全外顯子組測序的腫瘤驅(qū)動基因(driver mutation)研究方案
為什么會產(chǎn)生癌癥?我們需要提到一個(gè)名詞:驅(qū)動基因,它可以說是決定癌癥的最主要原因。如何找到驅(qū)動基因,是制定癌癥治療措施的關(guān)鍵所在。根據(jù)目前的發(fā)現(xiàn),驅(qū)動基因包括:突變的EGFR、ALK融合基因、突變的KRAS、突變的HER2等的一大類都是驅(qū)動基因。例如,肺癌可按照驅(qū)動基因分為許多類,這是近年來非常重要的一個(gè)發(fā)現(xiàn)。由此可以根據(jù)不同的驅(qū)動基因,采用合適的藥物進(jìn)行治療。如果找到驅(qū)動基因,治療就事半功倍,如果沒有找到驅(qū)動基因而盲目治療,靶向治療效果較差,可能連安慰劑都不如。
全外顯子組測序是用于分析基因組蛋白質(zhì)編碼區(qū)域的一種功能強(qiáng)大的技術(shù)。這種大規(guī)模并行式分析結(jié)合了新一代測序的單分子分辨率,憑借能夠分析約含 20,000 個(gè)基因的外顯子基因組的高性價(jià)比單反應(yīng)方法,已經(jīng)在加速疾病基因發(fā)現(xiàn)中發(fā)揮了重要作用。
研究目的
² 利用配對的腫瘤樣本進(jìn)行高通量測序,檢測導(dǎo)致腫瘤發(fā)生的Driver mutation。
樣本準(zhǔn)備
- 血液樣本:EDTA抗凝,2ml,-20℃冰箱保存。
- 新鮮冰凍組織:液氮冷卻、-80℃冰箱保存。
- FFPE樣本:FFPE切片(10片左右,切片厚度在10μm左右)
測序深度建議
- 腫瘤樣本 ≥ 150X
- 血液及正常組織樣本≥ 100X
五、全外顯子組測序技術(shù)路線與生物信息分析展示

1.突變頻率分布圖

2. 突變功能分布圖

圖中展示了其中一個(gè)樣本突變功能分布情況。上方的餅圖表示在基因不同區(qū)域上(intron, exon, etc.)的變異所占的百分比;下方的餅圖表示在exon位置上不同變異類型所占的百分比。
3.樣本拷貝數(shù)變異區(qū)間圖


圖形上方展示每對樣本體細(xì)胞突變數(shù)目,下圖展示每對樣本體細(xì)胞突變不同突變類型所占的比例。
5. 樣本體細(xì)胞突變heatmap圖

6. 體細(xì)胞突變富集分析圖

左邊縱坐標(biāo)表示Go term,橫坐標(biāo)是富集因子(Rich Factor = Gene number/Total Gene Number of the term)。每個(gè)圓圈的大小與在這個(gè)Go Term上的基因成正比,顏色與根據(jù)q-value的log值從紅到綠漸變,越紅,q-value值越低,富集越顯著。
7. 家系連鎖分析LOD連鎖圖及單倍型圖

左圖為LOD連鎖圖,通常,LOD值≥3被認(rèn)為是兩個(gè)基因連鎖得確定證據(jù)(因?yàn)長OD值是以10為底的對數(shù)計(jì)算的,LOD值為3表明1000:1的機(jī)會,即所觀察到的連鎖不是偶然發(fā)生的);LOD值≥2時(shí),可能連鎖;-2<LOD值<2時(shí),需要更多地家系資料,尚不能判別是否連鎖;LOD值<-2時(shí),為不連鎖;右圖為致病位點(diǎn)單倍型圖,可以根據(jù)此圖判斷致病位點(diǎn)是否在家系患病成員中處于共分離狀態(tài)。
8. 曼哈頓圖(Manhattan Plot)

X-軸為基因組坐標(biāo),Y-軸為每個(gè)單核苷酸多態(tài)性的關(guān)聯(lián)P-值的負(fù)對數(shù)。
相關(guān)解決方案