English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個(gè)人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁(yè) > 技術(shù)文章 > 下一代測(cè)序技術(shù)將改變生物學(xué)現(xiàn)狀

下一代測(cè)序技術(shù)將改變生物學(xué)現(xiàn)狀

瀏覽次數(shù):5663 發(fā)布日期:2009-2-4  來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)
  新一代非基于“桑格技術(shù)”的基因測(cè)序法以空前的快速測(cè)序速度問(wèn)世了,它為人類帶來(lái)了重大的科學(xué)成果和先進(jìn)的生物學(xué)應(yīng)用軟件。然而,要研發(fā)出新一代基因測(cè)序法,必須克服30年來(lái)以桑格技術(shù)為基礎(chǔ)的慣性思維。

      1977年,F(xiàn)red Sanger 和Alan R. Coulson發(fā)表了兩篇關(guān)于快速測(cè)序技術(shù)的論文[1,2],該技術(shù)能夠破譯完整基因片斷和整個(gè)基因組,大大促進(jìn)了生物學(xué)的發(fā)展。該技術(shù)是以Sanger 和Coulson發(fā)現(xiàn)的加減法原理(1975年)為基礎(chǔ),大大減少了化學(xué)毒性物質(zhì)以及放射性同位素的處理,取代同年早期Maxam和Gilbert[3]發(fā)明的化學(xué)降解法成為近30年來(lái)唯一的DNA測(cè)序法[4]。

應(yīng)用桑格技術(shù)的哺乳動(dòng)物基因組測(cè)序中心擁有工廠式全套設(shè)備以及大量工作人員。(圖片來(lái)源:Maria Nemenuk, Broad Institute)

      完成人類基因組計(jì)劃的終極目標(biāo)需要大量基因序列,這種需求推動(dòng)了測(cè)序技術(shù)的發(fā)展,例如毛細(xì)血管電泳儀的出現(xiàn)。實(shí)驗(yàn)自動(dòng)化和程序并行化導(dǎo)致了一些擁有大規(guī)模測(cè)序設(shè)備與專家小組的測(cè)序中心出現(xiàn)。盡管目前已完成了兩個(gè)不同的人類基因組計(jì)劃,但是生物學(xué)家渴望知道更多的基因序列,更重要的是,他們希望有更經(jīng)濟(jì)的測(cè)序技術(shù)。

      2005年,介紹合成測(cè)序(sequencing-by-synthesis)方法(454生命科學(xué)公司研發(fā)[5])以及自動(dòng)測(cè)序軟件(George Church實(shí)驗(yàn)室研發(fā)[6])的劃時(shí)代性論文發(fā)表是測(cè)序市場(chǎng)創(chuàng)新的第一個(gè)標(biāo)志。這兩種測(cè)序技術(shù)應(yīng)用鉻鐵尖晶石板或者瓊脂糖薄板同時(shí)分析序列,與同期Sanger毛細(xì)管測(cè)序儀(極限為96個(gè)樣本)相比,具有以更小的反應(yīng)體積產(chǎn)生更多的序列數(shù)據(jù)的優(yōu)勢(shì)。

      454公司首推的測(cè)序儀能輕易的產(chǎn)生與50臺(tái)以上的全自動(dòng)化3730XL毛細(xì)管測(cè)序儀(Applied Biosystem's 3730XL capillary sequencers)相當(dāng)?shù)男蛄袛?shù)據(jù),成本花費(fèi)卻只是后者的1/6左右。盡管如此,科學(xué)界對(duì)這項(xiàng)新技術(shù)卻并不熱衷。許多習(xí)慣用桑格技術(shù)的科學(xué)家懷疑新技術(shù)的準(zhǔn)確度、閱讀能力、成本消費(fèi)、實(shí)用性。代理Sanger型測(cè)序硬件的經(jīng)銷商害怕其投資失敗而首先提出了這些懷疑。

      批評(píng)家為新測(cè)序技術(shù)的推廣設(shè)置了種種障礙,然而大多數(shù)人卻忽略了一個(gè)事實(shí),即桑格技術(shù)的普及最初也遇到同樣的阻礙。桑格技術(shù)剛開發(fā)出來(lái)時(shí),閱讀能力很難超過(guò)25bp,即使在Fred Sanger雙脫氧終止法發(fā)明后也只達(dá)到80bp,如今卻達(dá)到了750bp;而新發(fā)展的合成測(cè)序技術(shù),應(yīng)用焦磷酸測(cè)序方法,其閱讀能力最初只有100bp,推向市場(chǎng)16個(gè)月后增加至250bp,隨著技術(shù)的不斷完善,目前已達(dá)到了400bp,很快就接近桑格技術(shù)目前的水平。

      除了閱讀能力外,能否以有限的成本用一臺(tái)儀器產(chǎn)生足夠數(shù)量的序列標(biāo)記也是另一個(gè)需要改善的重要問(wèn)題。這個(gè)問(wèn)題已經(jīng)被454公司解決了,應(yīng)用他們的系統(tǒng),僅花費(fèi)閱讀35bp或者更小片段的成本就能產(chǎn)生比35bp多10倍的序列標(biāo)記。當(dāng)今,搶灘新一代測(cè)序市場(chǎng)的儀器主要有三種:羅氏公司的454 GS FLX測(cè)序儀,Illumina公司的Solexa 1G測(cè)序儀和最新開發(fā)的全自動(dòng)生化SOLiD系統(tǒng),以及VisiGen公司和Helicos公司預(yù)期最近兩年內(nèi)推出的第三代(也叫新二代)單分子測(cè)序技術(shù)。

      盡管Margulies等人[5]應(yīng)用原理論證了應(yīng)用一臺(tái)或者兩臺(tái)儀器能分析中小型細(xì)菌基因組,但大多數(shù)人不相信應(yīng)用焦磷酸測(cè)序方法可以彌補(bǔ)桑格技術(shù)的不足。最初,羅氏454 GS20測(cè)序儀被用來(lái)對(duì)細(xì)菌基因組再測(cè)序或者為正在進(jìn)行的龐大的“桑格工程”補(bǔ)充數(shù)據(jù)。這項(xiàng)工程初步階段需要做環(huán)境基因組學(xué)研究,不僅需要分析比人類基因組大得多的序列數(shù)據(jù),而且要解決文庫(kù)構(gòu)建和克隆產(chǎn)生的取舍偏差等問(wèn)題。這個(gè)時(shí)候,454技術(shù)利用乳滴PCR結(jié)合焦磷酸測(cè)序的優(yōu)勢(shì)迅速的打開了市場(chǎng)。乳滴PCR將單個(gè)DNA片段分子的擴(kuò)增片段分配到一個(gè)乳滴中,從而提高了產(chǎn)物的純度。另一方面,焦磷酸測(cè)序利用計(jì)算機(jī)高通量檢測(cè)反應(yīng)中產(chǎn)生的光信號(hào)。2006年,早期研究公開證實(shí)了新一代測(cè)序儀的多功能性能夠?yàn)樯畹V的微生物[7]、深海中的稀有生物圈[8]或者海洋中的有毒微生物進(jìn)行基因測(cè)序[9]。

      在2005年末,一個(gè)進(jìn)行環(huán)境基因組學(xué)與古生物DNA研究[10]的科研小組僅用一臺(tái)羅氏(454)GS20測(cè)序儀就分析出了28,000年前長(zhǎng)達(dá)13Mb的長(zhǎng)毛象基因組[10],從而為完成更有挑戰(zhàn)性的計(jì)劃——解密穴居人基因組鋪墊了道路[11,12]。解密古人類基因組比解密古象基因組更難,因?yàn)閺目捎玫臉颖局刑崛〉难ň尤薉NA數(shù)量不到從現(xiàn)代人樣本中提取量的5%。因此,進(jìn)行古人類基因組計(jì)劃需要比進(jìn)行現(xiàn)代人基因計(jì)劃多20多倍的序列測(cè)定工作量。

      最新的新一代測(cè)序儀操作只需一個(gè)人,24小時(shí)內(nèi)可產(chǎn)生與幾百臺(tái)桑格毛細(xì)管測(cè)序儀同樣多的序列數(shù)據(jù)。

      此外,樣品中DNA損傷與常溫貯藏的狀態(tài)以及新一代測(cè)序誤差等因素往往超過(guò)了序列變異,因此很難確定樣品來(lái)源于現(xiàn)代人類還是古穴人。相比較而言,斷言長(zhǎng)毛象的某一特定順序是來(lái)源于古代標(biāo)本,而不是現(xiàn)代污染物更容易,因?yàn)楝F(xiàn)代大象不像人類會(huì)經(jīng)常處在實(shí)驗(yàn)室環(huán)境中。要在基因組范圍內(nèi)得到古代哺乳動(dòng)物真正的序列,需要對(duì)某一區(qū)域進(jìn)行反復(fù)的分析或者結(jié)合多種方法來(lái)確定其來(lái)源,這又要求大量削減成本來(lái)額外開展該項(xiàng)目。如果能完成這一項(xiàng)目而且能突破為復(fù)雜的多來(lái)源的DNA混合物測(cè)序的難題,將使測(cè)序地球上的任何生態(tài)系統(tǒng)成為可能,它也為測(cè)序至少十萬(wàn)年前的古代動(dòng)植物打開了一扇窗戶,這些都遠(yuǎn)遠(yuǎn)超出了我們以前的預(yù)想。

      新一代測(cè)序儀已被用來(lái)再測(cè)序先前公布的參考細(xì)胞株,同時(shí)它也首次被允許查找基因組水平上的所有突變。在2005年,Velicer[14]等人首次從一種進(jìn)化了1000代的結(jié)核分枝桿菌株[13]的基因組(9Mb)上發(fā)現(xiàn)了所有的突變體,同時(shí)也研究確定了該菌株上的耐藥性等位基因。從這些早期的成果中,人們清楚地看到,新技術(shù)雖然能發(fā)現(xiàn)新的基因突變[14],但是它也必須解決許多測(cè)序中出現(xiàn)的錯(cuò)誤,如焦磷酸測(cè)序時(shí)出現(xiàn)的同聚物干擾和閱讀短片段時(shí)3'端序列迅速降解等問(wèn)題。

      初步的解決方法是聯(lián)合運(yùn)用桑格和焦磷酸測(cè)序數(shù)據(jù)[15]。不管進(jìn)行何種項(xiàng)目,只運(yùn)用桑格技術(shù),其人力和財(cái)力的消耗將是巨大的。許多實(shí)驗(yàn)室現(xiàn)在要么只依靠新一代測(cè)序數(shù)據(jù),要么結(jié)合焦磷酸測(cè)序法閱讀長(zhǎng)片段與illumina的solexa低營(yíng)運(yùn)成本的優(yōu)勢(shì),要么應(yīng)用生物系統(tǒng)的SOLiD平臺(tái),獨(dú)自來(lái)考察各種體系的性能。隨著更多有效的非桑格測(cè)序方法的發(fā)明,現(xiàn)在已經(jīng)能評(píng)估新一代測(cè)序的準(zhǔn)確性和評(píng)估絕大多數(shù)公布的桑格數(shù)據(jù)的正確性。

      大量生產(chǎn)密切相關(guān)的有機(jī)體的序列數(shù)據(jù)推動(dòng)了再測(cè)序的應(yīng)用。所謂再測(cè)序,就是以不同方式處理序列數(shù)據(jù)而不是重新組裝基因組。再測(cè)序以一個(gè)參考序列做對(duì)照,對(duì)目標(biāo)區(qū)域進(jìn)行8-12次排序,排序次數(shù)比從頭組裝基因組(25-70次)少得多。

      研究表明用這種方法能夠測(cè)序10個(gè)哺乳動(dòng)物線粒體基因組[16],從而使群體遺傳學(xué)能夠建立在完整的線粒體基因組而不是短序列片段研究的基礎(chǔ)上。目前,許多微生物測(cè)序項(xiàng)目已在開展,這將不僅有利于擴(kuò)大可用的基因組數(shù)據(jù)庫(kù),而且還使許多在基因組水平上比較基因型和表現(xiàn)型的研究成為可能。

      甚至,研究目前尚未測(cè)序的生物體也能應(yīng)用新一代測(cè)序法,直接從序列水平上破譯細(xì)胞的轉(zhuǎn)錄子。在許多方面,用基因序列來(lái)表示轉(zhuǎn)錄子的特性優(yōu)于用基因芯片表示。最重要的是,在排序前并不需要一定了解基因序列方面的知識(shí),因?yàn)榭梢越柚?jì)算機(jī)比照數(shù)據(jù)庫(kù)中最接近的參考序列,從而得到轉(zhuǎn)錄子序列。因此,轉(zhuǎn)錄子序列的獲得將會(huì)給生命科學(xué)帶來(lái)革命性的進(jìn)展。例如,參考豆科植物meticago truncatula時(shí)代的基因組和植物標(biāo)本Arabidopsis thaliana[17],科學(xué)家能夠?yàn)閆ea mays (玉米)[18]的cDNA排序,而且發(fā)現(xiàn)了大量以前未描述的序列標(biāo)簽。

      類似轉(zhuǎn)錄組學(xué)(transcriptomics)方法可以避免巨大基因組所造成的問(wèn)題。盡管桑格技術(shù)已經(jīng)成功完成病毒,微生物和大型哺乳動(dòng)物的測(cè)序計(jì)劃,但還是留下一個(gè)問(wèn)題——無(wú)法解析多倍體植物以及其后代的基因組。如小麥有16Gb的六倍體基因組,這些巨大的基因組,往往存在于農(nóng)作物中,僅利用舊測(cè)序法是無(wú)法得到其序列的。然而,應(yīng)用現(xiàn)在已證明的概念——新一代已表達(dá)序列標(biāo)志測(cè)序法花費(fèi)低得多,就至少能在功能水平上對(duì)植物基因組進(jìn)行評(píng)估[18]。

      最后,新一代測(cè)序法的應(yīng)用與醫(yī)學(xué)領(lǐng)域密切相關(guān)。例如在癌癥遺傳學(xué)方面的應(yīng)用,對(duì)于某些情況下用桑格技術(shù)不能檢測(cè)的癌基因[19],現(xiàn)在應(yīng)用超深測(cè)序法(ultra-deep sequencing)就可在組織中檢測(cè)到。當(dāng)桑格技術(shù)主要用來(lái)分析700bp以上的片段時(shí),新一代測(cè)序法利用其閱讀片段短的特點(diǎn),在測(cè)序領(lǐng)域得到重用。由于癌癥遺傳學(xué)不遵守孟德?tīng)栠z傳定律,激光捕獲顯微切割技術(shù)(laser-capture microdissection)用于收集相關(guān)等位基因而且必須使用PCR產(chǎn)物和/或擴(kuò)增子序列定向,這樣避免了傳統(tǒng)的克隆及PCR誤差。

      雖然新一代測(cè)序儀已經(jīng)應(yīng)用于多項(xiàng)研究,但是有許多不足有待科學(xué)家與工程師們進(jìn)一步改進(jìn)。首先是降低成本:若要實(shí)現(xiàn)進(jìn)行個(gè)人基因組研究的愿望,減少1-2個(gè)訂單的規(guī)模是必要的,個(gè)人的基因組再測(cè)序的目標(biāo)花費(fèi)為1000美元。此外,降低測(cè)序錯(cuò)誤率,這不僅是為了所有新一代測(cè)序技術(shù)的發(fā)展,而且還為了在不久的將來(lái)桑格測(cè)序技術(shù)能繼續(xù)被采用。今后可能會(huì)采用特定的DNA聚合酶發(fā)射光波的形式直接讀取DNA序列,但即使有了這些改進(jìn),我們還是不大可能看到DNA序列翻譯成機(jī)器可讀代碼。價(jià)格下降,數(shù)據(jù)量有可能會(huì)飛漲,這就會(huì)造成解析瓶頸。因此,大部分由未來(lái)新型測(cè)序儀器提供的數(shù)據(jù)增量,將抵消生物信息學(xué)方面增加的人力和財(cái)力消耗。

      在許多生命科學(xué)家認(rèn)為后基因組學(xué)研究已經(jīng)到來(lái)的時(shí)候,在短短不到兩年的時(shí)間里出版了1000多篇相關(guān)科研論文,新一代測(cè)序已顯示出巨大的潛力。它也使得基因組學(xué)返回到由單個(gè)科學(xué)家或小型科研單位來(lái)研究的方式,事實(shí)證明,大多數(shù)的新一代測(cè)序法論文來(lái)源于小型研究個(gè)體而非基因組中心。在不久的將來(lái)往回看,我們肯定會(huì)驚訝為什么最初新測(cè)序技術(shù)在科學(xué)界乃至商業(yè)界不受歡迎。當(dāng)?shù)谌臏y(cè)序儀器被推廣的時(shí)候,我們可從中窺探到創(chuàng)新能打破桑格技術(shù)壟斷測(cè)序市場(chǎng)30多年的格局。

原文檢索:http://www.nature.com/nmeth/journal/v5/n1/full/nmeth1156.html

參考文獻(xiàn):
[1]Sanger, F. et al. Nature 24, 687–695 (1977).
[2]Sanger, F., Nicklen, S. & Coulson, A.R. Proc. Natl. Acad. Sci. USA 74, 5463–5467 (1977).
[3]Maxam, A.M. & Gilbert, W. Proc. Natl. Acad. Sci. USA 74, 560–564 (1977).
[4]Sanger, F. & Coulson, A.R. J. Mol. Biol. 94, 441–448 (1975).
[5]Margulies, M. et al. Nature 437, 376–380 (2005).
[6]Shendure, J. et al. Science 309, 1728–1732 (2005).
[7]Edwards, R.A. et al. BMC Genomics 7, 57 (2006).
[8]Sogin, M.L. et al. Proc. Natl. Acad. Sci. USA 103, 12115–12120 (2006).
[9]Angly, F.E. et al. PLoS Biol. 4, 2121–2131 (2006).
[10]Poinar, H.N. et al. Science 311, 392–394 (2006).
[11]Green, R.E. et al. Nature 444, 330–336 (2006).
[12]Noonan, J.P. et al. Science 314, 1113–1118 (2006).
[13]Andries, K. et al. Science 307, 223–227 (2005).
[14]Velicer, G.J. et al. Proc. Natl. Acad. Sci. USA 103, 8107–8112 (2006).
[15]Goldberg, S.M. et al. Proc. Natl. Acad. Sci. USA 103, 11240–11245 (2006).
[16]Gilbert, M.T.P. et al. Science 317, 1927–1930 (2007).
[17]Cheung, F. et al. BMC Genomics 7, 272 (2006).
[18]Ohtsu, K. et al. Plant J. 52, 391–404 (2007).
[19]Thomas, R.K. et al. Nat. Genet. 39, 347–351 (2007).

發(fā)布者:上海伯豪生物技術(shù)有限公司
聯(lián)系電話:021-58955370
E-mail:market@shbio.com

用戶名: 密碼: 匿名 快速注冊(cè) 忘記密碼
評(píng)論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請(qǐng)輸入驗(yàn)證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com