【佳學(xué)基因檢測(cè)】如何將全基因組測(cè)序(WGS)基因檢測(cè)數(shù)據(jù)定位到人的標(biāo)準(zhǔn)基因組上?
在全基因組測(cè)序中,測(cè)序讀取的基因序列數(shù)據(jù)的比對(duì)和匹配意味著對(duì)測(cè)序數(shù)據(jù)進(jìn)行排列,以便可以比較特定點(diǎn)的序列。 在這些點(diǎn)上,我們期望這些序列相同,因?yàn)檫@些是參考基因組中的同源點(diǎn),并將任何不匹配解釋為正在測(cè)試的序列中的變異。 在臨床實(shí)踐中,這是遺傳數(shù)據(jù)分析的先進(jìn)步,涉及將樣本基因組與參考基因組進(jìn)行比對(duì)并觀察潛在差異,這些差異隨后被解釋為遺傳變異、基因突變或者是基因序列變化。 佳學(xué)基因檢測(cè)開(kāi)發(fā)了成對(duì)全局比對(duì)的形式,利用測(cè)序讀數(shù)的相似性來(lái)近似兩個(gè)序列之間的同源性。 隨后,史密斯和沃特曼開(kāi)發(fā)了賊佳成對(duì)局部比對(duì),其設(shè)計(jì)用于子序列的比對(duì)。 有效的全基因組比對(duì)的概念解決方案是劃分子序列,然后應(yīng)用局部比對(duì)算法。
在當(dāng)今的臨床基因測(cè)序中,測(cè)序數(shù)據(jù)的分析是在稱(chēng)為數(shù)據(jù)分析流和的過(guò)程中進(jìn)行的。 這些可以分為上游流科和下游流和,上游流程執(zhí)行讀取比對(duì)和匹配的工作,下游流程指定用于遺傳變異調(diào)用。 佳學(xué)基因檢測(cè)比較了 WGS 中的兩種比對(duì)和作圖方法,即利用賊常用的 BWA-MEM2 2.2.1 的 GATK 和 DRAGEN 3.8.4。 雖然有人認(rèn)為 DRAGEN 優(yōu)于 GATK 的結(jié)論,但他們也強(qiáng)調(diào)了在基因組比對(duì)和作圖系統(tǒng)方面進(jìn)行比較的重要方面。 首先,比對(duì)系統(tǒng)的比較按單核苷酸變異(SNV)和插入刪除變異(Indel)進(jìn)行細(xì)分。 SNV 代表比較測(cè)序數(shù)據(jù)中發(fā)現(xiàn)的同源點(diǎn)的序列變化,并將被檢測(cè)為不匹配。 另一方面,插入缺失表示添加或缺失的值,這會(huì)導(dǎo)致整個(gè)讀取發(fā)生變化。 正是由于這種差異,SNV 和 Indel 對(duì)比對(duì)系統(tǒng)提出了不同的挑戰(zhàn)。 此外,比較是根據(jù)插入缺失大小進(jìn)行分類(lèi)的,插入缺失大小可能意味著序列中多個(gè)基因序列的增加或丟失,以及是否存在編碼區(qū)域或非編碼區(qū)域的問(wèn)題。 一旦根據(jù)這些差異對(duì)算法進(jìn)行分層,就可以觀察完成時(shí)間和檢測(cè)精度等參數(shù)。
基因圖譜已成為許多醫(yī)學(xué)學(xué)科個(gè)性化醫(yī)療方法中的一項(xiàng)重要資產(chǎn),但也許在腫瘤學(xué)領(lǐng)域賊為明顯,佳學(xué)基因正在進(jìn)行的項(xiàng)目旨在完成癌癥基因組的全球圖譜繪制。 在綜合論文中廣泛強(qiáng)調(diào)了這一問(wèn)題,討論了現(xiàn)代這一研究領(lǐng)域的各個(gè)方面。 正如基因解碼基因檢測(cè)的研究所強(qiáng)調(diào)的那樣,神經(jīng)學(xué)是利用基因圖譜的眾多學(xué)科中的另一個(gè)。 它描述了血清蛋白質(zhì)組與神經(jīng)系統(tǒng)疾病的映射。