【佳學基因檢測】將基因信息大眾化的第二代高通量測序技術(NGS)
第二代測序技術也稱高通量測序(high-throughput sequencing,HTS)技術,相對于一代測序,它可以實現(xiàn)大規(guī)模平行測序,基本原理是將基因組分割成短片段,對短片段測序再進行拼接。
對比先進代測序技術擁有著高通量、低成本等優(yōu)勢,目前相同數(shù)據(jù)量的檢測,其成本約為一代測序技術的0.01%,極大地推動了測序技術在臨床檢測方面的應用。
2005年454公司基于焦磷酸測序法推出了Genome Sequencer 20 System(GS 20)系統(tǒng),開啟了高通量測序的進程。2007年,羅氏公司收購了454,并推出了一系列性能更優(yōu)的NGS系統(tǒng),極大的提升測序通量和正確性。
盡管具有讀長優(yōu)勢,但是測序通量和成本始終限制了454平臺的推廣,同樣數(shù)據(jù)量下成本約是illumina的100倍,因此羅氏在2016年底終止了454NGS測序 相關的業(yè)務。
2006年Solexa公司推出了Genome Analyzer系統(tǒng),包括DNA簇、橋式PCR和可逆阻斷等技術,這使得GA系統(tǒng)在高通量、低成本、應用范圍廣等方面具有明顯優(yōu)點。2007年,Illumina公司收購了Solexa并發(fā)布二代測序儀。
二代測序經過這些年的發(fā)展已經步入成熟期,目前市場上根據(jù)測序技術可以可以把二代測序平臺分為4類:邊合成邊測序法(Illumina)、半導體測序法(ThermoFisher)、聯(lián)合探針錨定聚合測序法(華大智造)和焦磷酸測序法。
Illumina邊合成邊測序
Illumina測序的流程主要包括樣品制備,簇生成,測序,數(shù)據(jù)分析。
首先是樣本制備和建庫。用DNA或RNA抽提試劑盒提取核酸,然后用超聲波將其隨即打斷成90-250bp左右的長度或者控制全部DNA在一定長度范圍內。
為了后續(xù)的擴增和測序,需要在這些DNA片段加入特定的序列。如下圖,分別是與流動池引物互補結合的區(qū)域(P5、P7)、與Read 1和read 2測序引物結合的區(qū)域(Rd1SP,Rd2 SP)以及標簽序列區(qū)域Index。
圖片
添加完接頭序列的DNA合集稱為DNA文庫,這樣就完成了建庫,該步驟可以采用商業(yè)化的文庫制備試劑盒完成。
第二步是成簇Cluster Generation。
成簇是上述DNA片段被擴增的過程,該過程在流動池(Flow cell) 中完成。流動池是一種含有8個通道的厚玻璃片,每條通道中都隨即植入了能與文庫接頭P5或P7互補結合的短DNA片段。
圖片
首先引物和流動池的固定DNA片段互補配對,固定在通道表面,然后在DNA聚合酶作用下DNA鏈進行互補延伸形成DNA雙鏈。通過變性,其中的單鏈被洗脫,剩下的一條單鏈會與旁邊的固定接頭鏈接,形成單鏈橋。
圖片
同樣的,單鏈橋在DNA聚合酶作用下延伸配對形成雙鏈橋,通過變性形成2條單鏈,這兩條單鏈又分別與旁邊的固定引物結合,形成2個單鏈橋。重復這個循環(huán),賊終形成數(shù)百萬的DNA簇。
圖片
上述過程所有的DNA片段都會被擴增,擴增結束后,反向連會被切斷洗脫,只留下正向鏈,為防止互補結合重新形成單鏈橋,3‘端被封鎖。
圖片
第三步,測序。
首先,在流動池中加入熒光標記的dNTP和酶,由引物起始開始合成子鏈。由于dNTP存在 3’端疊氮基會阻礙子鏈延伸,因此每個循環(huán)只能測得一個堿基。合成完一個堿基后,洗掉多余的dNTP和酶,使用激光掃描獲得熒光信號。
隨后加入試劑將疊氮基團與熒光基團切除,然后流動池再通入熒光標記的dNTP和酶,由引物起始開始合成一個堿基。不斷重復這個過程,完成先進次讀取。
圖片
所有的DNA片段的一個堿基會被同時讀取,在大規(guī)模并行的過程中,機器讀取的圖像類似下面這樣:
圖片
同時,加入了不同的index來區(qū)分每個樣本及正負鏈。在完成先進次讀取后,復制出的鏈會被洗去,index片段引物被引入并與模板雜交,完成序列讀取后被洗去。這樣讀取到的序列與開始時已知的index比對后就可以給測得的序列貼上標簽,方便后續(xù)分析。
Paired-end測序已經是現(xiàn)在的主流,要完成雙末端測序,首先要將模板鏈3’去保護,模板折疊,index片段引入,在聚合酶參與下形成雙鏈橋,然后變性,恢復為單鏈,然后將正向鏈切除并洗去,留下反向鏈,與正向鏈類似,經過多個循環(huán)后完成讀取。
第四步,數(shù)據(jù)分析
測序完成后會產生數(shù)百萬個reads,基于在樣品準備時構建的index 分類來自不同樣本的序列。對于每個樣品來說,具有相似延伸的堿基被聚在一起。正向和反向read配對生成連續(xù)序列。這些序列通過與參考基因組匹配后,實現(xiàn)完整序列的構建。
Thermo Fisher半導體測序法
賽默飛的Ion Torrent平臺是基于半導體技術的高通量測序儀。該平臺使用了一種布滿小孔的高密度半導體芯片,一個小孔就是一個測序反應池,孔底部帶有感應器。
圖片
其測序的核心技術是利用半導體技術進行信息讀取,測序過程中每當有堿基結合,便會釋放H+,而氫離子會引起電勢的改變從而被檢測到。通過對氫離子的檢測并轉化為電信號,賊終實現(xiàn)實時堿基判讀。
其測序的流程主要包括建庫,油包水PCR,測序,數(shù)據(jù)分析。
首先是建庫
與illumina 的 3’端帶突出 T 堿基粘性末端的接頭有所不同,建庫過程中DNA兩端加入的是平端接頭(P1)和X或A接頭,X接頭帶有index,A接頭不帶。
圖片
X 接頭帶Barcode 序列(近末端藍色序列),而A 接頭不帶Barcode 序列。
X 接頭的好處是可以把一個芯片的測序通量分配給多個文庫,測完序之后用Barcode 區(qū)分。
A 接頭的好處是直接測到樣本序列,這樣對于充分利用測序的讀長無疑是更好的。但是它的缺點是沒有Barcode,所以一張芯片只能放一個樣本。
AmpliSeq 是Ion Torrent 平臺上的建庫方案,它的核心是通過多重PCR 的方法,一次從樣本中把要測序的多個DNA 片段給擴增出來,然后轉化成文庫進行測序。
圖片
PCR 產物兩端20-30bp 堿基都是 PCR引物的序列,如果將其進行測序,則會浪費掉相當一部分測序讀長及數(shù)據(jù)量。因此在這個引物上特別設計了一種化學修飾,這種化學修飾可以被Fupa試劑所消化,而后的測序就可以盡可能多地測到樣本序列。
乳液PCR或油包水PCR
Ion Torrent 測序前需要把文庫結合到測序微珠上去,并且進行擴增,此種方法稱為油包水PCR,也稱Emulsion PCR(乳液PCR)。
EP 管中包含油相和水相,其中水相是核心,油相起到分隔作用。水相中包括文庫、引物、酶、MasterMix、測序微珠等PCR反應的主要成份。
圖片
測序微珠的直徑約1~2.4微米,每個油包水PCR都含有許多微珠,這些微珠的表面共價連接了許多PCR引物,與P1序列互補。
同時油包水PCR中的游離PCR引物,其序列與A/X接頭一致,且5‘端都標記了生物素。
把引物、酶、測序微珠等先在水相中混合,再加入油,混合形成乳濁液,油把水相分隔成一個個的小水滴。PCR反應后,微珠表面就會長出水滴內所含DNA 文庫的擴增拷貝。
圖片
然后加入帶有鏈霉親和素標記的磁珠與微珠進行混合。發(fā)生了PCR 的微珠由于其引物上帶有生物素,便會與磁珠結合;沒有發(fā)生PCR 的微珠由于沒有生物素,不會與磁珠結合。接著,用磁鐵吸附富集有效微珠,再清洗掉上清液中沒有PCR 的微珠,賊后用洗脫液把微珠與磁珠分離開來,進行測序。
測序
測序主要發(fā)生在一張半導體芯片上,上面做了數(shù)以百萬、千萬計的小孔,每個小孔的既是測序微珠的容器,又同時是一個微型的PH 計。
每個小孔正好可以容納一個測序微珠,當DNA聚合酶把核苷酸聚合到延伸的DNA鏈上時,會釋放出一個氫離子,反應池中的PH發(fā)生改變,位于池下的離子感受器就會感受到信號,把化學信號直接轉化為數(shù)字信號,從而讀出DNA序列。
圖片
數(shù)據(jù)分析
把分別含A、C、G、T 四種 dNTP 的溶液,分別依次地流過芯片的表面。
舉例來說,流入的是dCTP 溶液,而模板上正好有一個G 堿基,就發(fā)生聚合反應,并產生電壓變化,而且會被記錄下來。如果流入的溶液與模板上的堿基不匹配,就不會發(fā)生聚合反應,也就沒有電壓變化,也就不會有堿基被記錄下來。
如果正好有 2 個一樣的堿基相鄰,一次就會有2 個堿基被聚合到DNA 鏈上,電壓變化值就會加倍,序列中2 個新的堿基被記錄下來。
華大智造聯(lián)合探針錨定聚合測序法
2013年3月18日,華大基因對CG(Complete Genomics)公司全額收購,開啟了華大測序儀之路。歷經多年的研發(fā)和改進,華大基因相繼推出的BGISEQ-500、BGISEQ-50、MGISEQ-200、MGISEQ-2000M、MGISEQ-T7等測序體系。
其測序平臺采用的是DNB(DNA Nanoball ,DNA納米球)測序技術,每個DNA的直徑約220-240nm。
主要步驟包括文庫制備,cPAS測序,數(shù)據(jù)分析等。
樣本準備和建庫
MGI文庫構建采用泡狀接頭及與之對應的擴增產物,有長接頭及短接頭,單端和雙端index。
圖片
將文庫進行單鏈分離及環(huán)化處理后,以單鏈環(huán)狀DNA為模板,在DNA聚合酶作用下使用滾環(huán)擴增將單鏈環(huán)狀DNA擴增2-3個數(shù)量級,此時擴增產物被稱為DNB。
圖片
DNB經過DNB裝載技術固定在陣列化的硅芯片上形成納米芯片,由于一個DNB結合到芯片上的小孔后會排斥其他DNB結合,因此每個小孔僅容納一個DNB,高效了信號點間不會相互干擾。
測序
采用半導體加工工藝,在經過修飾的硅片表面形成結合位點陣列(直徑約200nm),實現(xiàn)DNA納米球的規(guī)則排列吸附,陣列位點的間距約700nm,每個位點只固定一個DNB,高效不同納米球之間的光信號不會互相干擾。
帶有熒光探針的Read1引物在DNB上匹配互補,隨后系統(tǒng)對光信號采集,得到待測序列。
MDA(multipledisplacement amplification)二鏈測序,隨機引物在多個位點與模板DNA結合,在Phi29DNA聚合酶作用下起始復制,沿著DNA模板合成DNA,同時取代模板互補鏈;被置換的互補鏈又變成新的模板進行后續(xù)擴增。完成先進鏈測序后,在該酶作用下形成第二鏈,通過DNA分子錨,進行第二鏈cPAS測序。
圖片
(責任編輯:佳學基因)