【佳學基因檢測】血液腫瘤基因檢測分析:UMI技術及高靈敏度分析
腫瘤靶向藥物基因檢測導讀:
佳學基因才用下一代測序(NGS, 新一代測序)技術,在一次檢測中,可以獲得病人體內的海量基因信息。許多檢測機構無法處理這樣的數據和基因突變位點,因此,采用基因檢測包、部分有限的位點來回避。佳學基因開發(fā)的腫瘤液體活檢技術解決了大數據、低豐度突變帶來的挑戰(zhàn),包括測序錯誤的處理、外外源錯誤的鑒別。這些先進的分析技術結合基因解碼在癌癥的診斷、監(jiān)測、檢測、治療中尤其重要,例如檢測循環(huán)腫瘤DNA中的低等位基因頻率變異。使用少有分子標識符(UMI)對DNA分子進行條形碼標記,以減少測序錯誤;UMI標記的分子被聚合酶鏈反應(PCR)擴增,并且UMI標記分子的PCR拷貝被獨立測序。這都是癌癥的分子診斷中重要的細節(jié)。PCR和測序步驟可能會在條形碼和/或DNA序列中的測序讀取中產生錯誤。佳學基因為分析UMI標記的測序數據開發(fā)了聚類策略,可以從同一個UMI標記分子的PCR重復序列中測序的讀數分組到一個單獨的數據組中。其技術的更先進性還在于解決數據集的大小對聚類過程的資源利用效率。
本文關鍵詞
血液,腫瘤,基因檢測,分析,UMI,技術,高靈敏度,診斷
大數據低豐度的腫瘤基因檢測分析及診斷策略
佳學基因開發(fā)了China Calib計算工具,可以對由替換錯誤占主要類型的測序平臺(如Illumina)生成的UMI標記測序實驗的成對末端原始數據進行聚類分析。China Calib, 有人稱之為中國聚類算法是一個圖的連通部分,其邊根據條形碼相似性和讀取序列相似性來定義。該圖是使用局部敏感哈希和賊小哈希技術高效構造的。中國Calib的默認聚類參數是使用與Calib打包的模擬模塊,針對不同的UMI和讀取長度進行經驗優(yōu)化的。與其他工具相比,Calib在保持合理的運行時間和內存占用的同時,對模擬數據具有賊佳的正確性。在真實的數據集上,Calib運行的資源遠遠少于基于比對的方法,其集群減少了下游變量調用中的試探性假陽性數量。