隨著測(cè)序技術(shù)的飛速發(fā)展,眾多測(cè)序手段現(xiàn)已走進(jìn)實(shí)驗(yàn)室,成為科學(xué)家的科研利器,第二代DNA測(cè)序技術(shù)又稱下一代測(cè)序技術(shù)(Next-generation sequencing,NGS)是目前應(yīng)用廣泛的測(cè)序手段之一,下面我們通過(guò)一些普遍的問(wèn)題來(lái)慢慢了解它。
Q:什么樣本可以做NGS測(cè)序分析?
A:NGS實(shí)驗(yàn)不挑樣本,動(dòng)物、植物、微生物等具有遺傳信息的物種都可以進(jìn)行NGS測(cè)序?qū)嶒?yàn)分析,但是需要老師根據(jù)自己的實(shí)驗(yàn)設(shè)計(jì)和需求來(lái)選擇測(cè)序樣本類型和檢測(cè)項(xiàng)目。
Q:我們進(jìn)行分析時(shí)使用的參考基因組是怎么來(lái)的?
A:通過(guò)Denovo測(cè)序(也就是從頭測(cè)序)得到數(shù)據(jù),然后拼接得到基因組序列,再通過(guò)不斷的完善和功能注釋,給到我們現(xiàn)在使用。
Q:什么是重測(cè)序Resequencing?
A:待測(cè)物種如果有發(fā)表過(guò)的參考基因組,重新進(jìn)行測(cè)序就不需要拼接,可以直接對(duì)測(cè)序reads進(jìn)行短序列比對(duì)。簡(jiǎn)而言之就是對(duì)基因組序列已知的物種個(gè)體進(jìn)行基因組重新測(cè)序,本質(zhì)就是找變異。所以我們的重測(cè)序項(xiàng)目下機(jī)數(shù)據(jù)都是不拼接的。
Q:什么是測(cè)序深度,與基因覆蓋度是一回事嗎?
A:測(cè)序深度(Sequencing Depth)是指:測(cè)序得到的堿基總量(bp)與基因組(轉(zhuǎn)錄組或測(cè)序目標(biāo)區(qū)域大小)的比值,是評(píng)價(jià)測(cè)序量的指標(biāo)之一。例如:人類全基因組大約3G,測(cè)序深度30×的話,即獲得3×30=90G的數(shù)據(jù)量;覆蓋度(coverage)是指測(cè)序獲得的序列占整個(gè)基因組的比例。由于基因組中的高GC、重復(fù)序列等復(fù)雜結(jié)構(gòu)的存在,測(cè)序最終拼接組裝獲得的序列往往無(wú)法覆蓋所有的區(qū)域,這部分未覆蓋的區(qū)域就稱為Gap。
Q:重測(cè)序要求測(cè)序深度,是越多越好嗎?大約多少×合適?
A:測(cè)序深度當(dāng)然是越多越好,但是考慮到芯片大小以及資源浪費(fèi)的問(wèn)題,一般推薦10-30×,適用于有參物種,根據(jù)分析需求不同,選擇合適的深度測(cè)序(SNP/InDel >10×; SV > 20×; CNV > 30×, 轉(zhuǎn)座子> 20×),增加測(cè)序深度可以提高基因組覆蓋度和變異檢出率。
如果小伙伴們有想要了解的問(wèn)題可留言告訴我們,更多二代測(cè)序常見問(wèn)題解答會(huì)陸續(xù)發(fā)布,敬請(qǐng)期待!