【佳學(xué)基因檢測】癌癥序列變異解釋與報告標(biāo)準(zhǔn)指南:如何高效腫瘤基因檢測的正確性?
ASCO和CAP聯(lián)合推薦
肺癌基因檢測單位選擇標(biāo)準(zhǔn)簡介
肺癌是中國先進(jìn)大發(fā)病率癌癥,佳學(xué)基因投入大量人力物力專注于良性、惡性腫瘤的產(chǎn)生原因、阻抑方式、靶向藥物及免疫藥物的選擇和使用方法。提出基因解碼是腫瘤早期預(yù)測、個性化治好的信息依據(jù),并指出基因解碼解密基因序列變異與腫瘤診斷與治療的關(guān)系要優(yōu)先于基于數(shù)據(jù)庫比對的基因檢測。關(guān)于癌癥序列變異解釋與報告標(biāo)準(zhǔn)指導(dǎo)是將整個行業(yè)推向正確方向的先進(jìn)步。
1. 引言
基于二代測序技術(shù)的腫瘤檢測已越來越多的應(yīng)用于臨床實驗室中,但目前在不同實驗室間存在檢測方法、報告內(nèi)容等方面的差異,這對遺傳檢測的解讀以及普及應(yīng)用造成了一定的影響。因此,在不同實驗室間建立統(tǒng)一的分子檢測結(jié)果的解讀和報告標(biāo)準(zhǔn),及建立行業(yè)標(biāo)準(zhǔn),顯得尤為迫切。
在2015年春天,在美國專門成立了一個以臨床實驗室為核心的工作組,其組成包含了分子病理協(xié)會(AMP)、美國醫(yī)學(xué)遺傳學(xué)與基因組學(xué)協(xié)會(ACMG)、美國臨床腫瘤學(xué)會(ASCO)與美國病理學(xué)家協(xié)會(CAP)的一線專家,該工作組的主要工作為對腫瘤及疑似腫瘤相關(guān)的序列變異檢測建立檢測標(biāo)準(zhǔn)并在行業(yè)達(dá)成共識。
該工作組首先對北美地區(qū)超過40家的臨床檢測實驗室進(jìn)行了問卷調(diào)查,結(jié)果顯示不同實驗室在檢測組織類型、檢測基因數(shù)量、是否檢測腫瘤組織全外顯子組或全基因組、以及其他細(xì)節(jié)方面都存在較大差別,此外在不同單位的檢測報告的報告內(nèi)容方面也存在較多差異。該工作組認(rèn)為,為醫(yī)療機構(gòu)提供分類的遺傳變異報告對病人及整個醫(yī)療行業(yè)都極為重要,包括:提供正確的腫瘤對靶向治療反應(yīng)性信息;建立先進(jìn)別的醫(yī)療指南;以及與臨床試驗合作,對建立不同實驗室間的通用標(biāo)準(zhǔn)提供支持。基于以上這些考量,工作組專家們根據(jù)已有數(shù)據(jù)、文獻(xiàn)報道和專業(yè)知識,給出以下指南建議。
圖1 AMP對NGS技術(shù)及NGS結(jié)果解讀的調(diào)研
圖注:
A: MAF閾值;B: 變異分類數(shù)目;C:報告中是否包含治療性建議;D: 報告中是否包含潛在的生殖細(xì)胞突變;
E: 報告是否包含變異等位頻率Variant allele frequency (VAF);F: 報告是否包含基因組坐標(biāo);
G: 報告是否包含轉(zhuǎn)錄本ID(Transcript accession);H: 報告是否包含不符合質(zhì)控的基因/區(qū)間。
2. 術(shù)語
dbSNP, The Database of Short Genetic Variation;
ExAC, Exome Aggregation Consortium;
IARC, International Agency for Research on Cancer;
NCBI, National Center for Biotechnology Information;
SNV, single-nucleotide variant;
UCSC, University of California, Santa Cruz;
WHO, World Health Organization;
FDA, Food and Drug Administration;
CNV, copy number variation;
COSMIC, Catalog of Somatic Mutations in Cancer;
HGMD, Human Gene Mutation Database;
indel, insertion and deletion;
LOF, loss of function;
MAF, minor allele frequency;
PG, professional guideline;
TCGA, The Cancer Genome Atlas;
VAF, variant allele frequency.
3. 數(shù)據(jù)庫
3.1 基因組數(shù)據(jù)庫
3.1.1 大型腫瘤基因組數(shù)據(jù)庫
1. The National Cancer Institute’s Genome Data Commons:
- The Cancer Genome Atlas(TCGA)
- Therapeutically Applicable Research to Generate Effective Therapies(TARGET)
- the Cancer Genome Characterization Initiative
2. Catalog of Somatic Mutations in Cancer
3.1.2 體細(xì)胞序列變異解釋相關(guān)數(shù)據(jù)庫
表1 體細(xì)胞序列變異解釋相關(guān)數(shù)據(jù)庫
Utility/function | Database | Location (web address) |
Population databases to exclude polymorphisms | √1000 Genomes Project16√ | http://browser.1000genomes.org |
Exome Variant Server | http://evs.gs.washington.edu/EVS | |
√dbSNP17√ | http://www.ncbi.nlm.nih.gov/snp | |
dbVar18√ | http://www.ncbi.nlm.nih.gov/dbvar | |
ExAC√ | http://exac.broadinstitute.org | |
Cancer-specific variant databases | √Catalog of Somatic Mutations in Cancer19√ | http://cancer.sanger.ac.uk/cosmic |
My Cancer Genome | http://www.mycancergenome.org | |
Personalized cancer therapy, MD Anderson Cancer Center | https://pct.mdanderson.org | |
cBioPortal, Memorial Sloan Kettering Cancer Center20 | http://www.cbioportal.org | |
Intogen21 | https://www.intogen.org/search | |
ClinicalTrials.gov | https://clinicaltrials.gov | |
IARC (WHO) TP53 mutation database22 | http://p53.iarc.fr | |
Pediatric Cancer Genome Project (St. Jude Children’s Research Hospital–Washington University) | http://explorepcgp.org | |
International Cancer Genome Consortium23√ | https://dcc.icgc.org | |
Sequence repositories and data hosts | NCBI Genome | http://www.ncbi.nlm.nih.gov/genome |
RefSeqGene24 | http://www.ncbi.nlm.nih.gov/refseq/rsg | |
Locus Reference Genomic25 | http://www.lrg-sequence.org | |
UCSC table browser26 | https://genome.ucsc.edu/cgi-bin/hgTables | |
Ensemble BioMart27√ | http://useast.ensembl.org/biomart/martview | |
Other disease/mutation databases useful in the context of variant interpretation for cancer genomics | √ClinVar28√ | http://www.ncbi.nlm.nih.gov/clinvar |
√Human Gene Mutation Database29√ | http://www.hgmd.org | |
Leiden Open Variation Database30 | http://www.lovd.nl | |
dbNSFP (compiled database of precomputed in silico prediction scores for nonsynonymous SNVs)31√ | https://sites.google.com/site/jpopgen/dbNSFP | |
Ensemble Variant Effect Predictor15 | http://www.ensembl.org/info/docs/tools/vep/index.html |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
3.1.3 臨床實驗室在應(yīng)用公共數(shù)據(jù)庫時一般的注意事項
1. 了解數(shù)據(jù)庫內(nèi)容及數(shù)據(jù)組織形式;
2. 特別注意數(shù)據(jù)庫的限制,避免檢測結(jié)果過度解讀;
3. 注意基因組與轉(zhuǎn)錄組的組裝版本,應(yīng)與Human Genome Variation Society (HGVS)注釋一致;
4. 根據(jù)已有資源評估基因組測序質(zhì)量;
5. 確認(rèn)用于病理診斷的數(shù)據(jù)質(zhì)量。
3.2 參考序列數(shù)據(jù)庫
常見參考序列數(shù)據(jù)庫用于人類基因組組裝及相關(guān)信息,包括基因組坐標(biāo),轉(zhuǎn)錄本編號與版本,外顯子邊界等等。常見的有:
- √RefSeq (National Center for Biotechnology Information Reference Sequence Database,https://www.ncbi.nlm.nih.gov/refseq, last accessed January 2, 2016),
- √Ensembl (http://www.ensembl.org/index.html, last accessed January 2, 2016),
- Locus Reference Genomic (https://www.lrg-sequence.org,last accessed February 2, 2016)
3.3 人群數(shù)據(jù)庫
人群數(shù)據(jù)庫提供基因多態(tài)性、人群等位基因頻率等信息,用于區(qū)分測序結(jié)果中的多態(tài)性與突變,常見的有:
- The Database of Short Genetic Variation (the National Center for Biotechnology Information database of genetic variation)
- Exome Variant Server
- √Exome Aggregation Consortium
3.4 腫瘤特異性數(shù)據(jù)庫
腫瘤特異性數(shù)據(jù)庫提供匯總之后的不同腫瘤類型及亞型間的序列變異發(fā)生率,還包括發(fā)表的文獻(xiàn)、臨床試驗、成果數(shù)據(jù)等數(shù)據(jù),見表1 Cancer-specific variant databases。
3.5 原發(fā)性變異數(shù)據(jù)庫
原發(fā)性變異數(shù)據(jù)庫(Constitutional Variant Databases)主要用于區(qū)分生殖系變異與體細(xì)胞變異,常用的有:
- √Human Gene Mutation Database
- √ClinVar (http://www.ncbi.nlm.nih.gov/clinvar)
3.6 內(nèi)部數(shù)據(jù)庫(實驗室產(chǎn)生)
臨床實驗室根據(jù)內(nèi)部資源獨立建立的數(shù)據(jù)庫,可用于變異注釋,指南鼓勵將這些體細(xì)胞變異的注釋數(shù)據(jù)逐步整合到公共數(shù)據(jù)庫資源中去促進(jìn)體細(xì)胞變異的解釋。
4. 生物信息學(xué)預(yù)測算法
生物信息學(xué)預(yù)測算法常用于預(yù)測基因中核苷酸的變化是否會影響基因的結(jié)構(gòu)和蛋白質(zhì)的功能,總體上看,目前的生物信息學(xué)算法還無法高效足夠高的特異性(大約60%-80%),因此建議不要將預(yù)測結(jié)果作為臨床分類與臨床決策的證據(jù)。
表2 預(yù)測序列突變對基因結(jié)構(gòu)和蛋白質(zhì)功能影響的算法
Utilsity/function | Algorithm/software | Location (web address) |
Missense SNV | √PolyPhen237√ | http://genetics.bwh.harvard.edu/pph2 |
√SIFT38√ | http://sift.jcvi.org | |
MutationAssessor39√ | http://mutationassessor.org | |
MutationTaster41√ | http://www.mutationtaster.org | |
PROVEAN45 | http://provean.jcvi.org/index.php | |
Condel46 | http://bg.upf.edu/blog/2012/12/condel-for-prioritization-of-variants-involved-in-hereditary-diseases-and-transfic-for-cancer | |
CoVEC40 | https://sourceforge.net/projects/covec/files | |
CADD47√ | http://cadd.gs.washington.edu | |
GERP++48√ | http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html | |
PhyloP and PhastCons49√ | http://compgen.bscb.cornell.edu/phast | |
Splice site prediction | Human Splicing Finder42 | http://www.umd.be/HSF3 |
MaxEntScan43 | http://genes.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq.html | |
NetGene244 | http://www.cbs.dtu.dk/services/NetGene2 | |
NNSplice50 | http://www.fruitfly.org/seq_tools/splice.html | |
GeneSplicer51 | http://www.cbcb.umd.edu/software/GeneSplicer/gene_spl.shtml |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
5. 變異鑒定與注釋
通常由軟件來鑒定和注釋變異,比如點突變、插入缺失、結(jié)構(gòu)變異和拷貝數(shù)變異。臨床實驗室需注意軟件工具的局限性。測序深度、等位基因頻率等信息需加以考慮,在腫瘤異質(zhì)性評估中等位基因頻率對體細(xì)胞突變的解讀尤為重要,特別是在缺乏配對正常樣本的時候。目前較為通行的注釋文件格式為VCF格式,可從中分析相關(guān)信息。常見軟件有:
表3 突變注釋軟件
Software | Location (URL) |
Annovar√ | http://annovar.openbioinformatics.org/en/latest/ |
snpEff | http://snpeff.sourceforge.net/ |
SeattleSeq | http://snp.gs.washington.edu/SeattleSeqAnnotation138/ |
AnnTools | http://anntools.sourceforge.net/ |
NGS-SNP | https://www.ualberta.ca/~stothard/downloads/NGS-SNP/ |
VEP (Variant Effect Predictor) | http://useast.ensembl.org/info/docs/tools/vep/index.html |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
表4 突變解析軟件
Variant caller | Location (URL) |
MuTect v1.1.555 | https://www.broadinstitute.org/cancer/cga/mutect |
GATK – MuTect v2 | https://www.broadinstitute.org/gatk/guide/tooldocs/org_broadinstitute_gatk_tools_walkers_cancer_m2_MuTect2.php |
VarScan 256 | http://dkoboldt.github.io/varscan/ |
VarDict57 | https://github.com/AstraZeneca-NGS/VarDict |
Sterlka58 | https://sites.google.com/site/strelkasomaticvariantcaller/ |
FreeBayes59 | https://github.com/ekg/freebayes |
Scalpel60 | http://scalpel.sourceforge.net/ |
Pindel61 | http://gmt.genome.wustl.edu/packages/pindel/ |
SAMtools62 | http://samtools.sourceforge.net/ |
Torrent Suite Variant Caller | https://github.com/iontorrent/TS |
SomaticSniper63 | http://gmt.genome.wustl.edu/packages/somatic-sniper/ |
表注:
表格為不有效統(tǒng)計,賊后更新日期2016年6月7日。
6. 基于證據(jù)的體細(xì)胞變異分類的指導(dǎo)意見
基于循證醫(yī)學(xué)的體細(xì)胞變異分類的指導(dǎo)意見(Proposed Guideline for Evidence-Based Categorization of Somatic Variants),根據(jù)文獻(xiàn)報道及工作組專家共識,提議將基因檢測相關(guān)臨床及實驗證據(jù)分為4級:
表5 臨床及實驗證據(jù)分類
Category | Therapeutic | Diagnosis | Prognosis |
Level A | Biomarkers that predict response or resistance to FDA-approved therapies for a specific type of tumor | Biomarkers included in professional guidelines as diagnostic for a specific type of tumor | Biomarkers included in professional guidelines as prognostic for a specific type of tumor |
Biomarkers included in professional guidelines that predict response or resistance to therapies for a specific type of tumor | |||
Level B | Biomarkers that predict response or resistance to therapies for a specific type of tumor based on well-powered studies with consensus from experts in the field | Biomarkers of diagnostic significance for a specific type of tumor based on well-powered studies with consensus from experts in the field | Biomarkers of prognostic significance for a specific type of tumor based on well-powered studies with consensus from experts in the field |
Level C | Biomarkers that predict response or resistance to therapies approved by the FDA or professional societies for a different type of tumor | Biomarkers of diagnostic significance based on the results of multiple small studies | Biomarkers of prognostic significance based on the results of multiple small studies |
Biomarkers that serve as inclusion criteria for clinical trials | |||
Level D | Biomarkers of prognostic significance based on the results of multiple small studies | Biomarkers that may assist disease diagnosis themselves or along with other biomarkers based on small studies or a few case reports | Biomarkers that may assist disease prognosis themselves or along with other biomarkers based on small studies or a few case reports |
表注:
A級:可作為FDA批準(zhǔn)治療某種特異性腫瘤的生物標(biāo)志物(biomarker),或被收錄于某些特殊類型腫瘤的診斷、治療、預(yù)后評價的權(quán)威指南;
B級:可作為基于強力臨床試驗證據(jù)和專家共識的治療某種特異性腫瘤的生物標(biāo)志物,或用于診斷、預(yù)后評估;
C級:可用于指導(dǎo)FDA批準(zhǔn)的標(biāo)注外用藥,或基于多個小規(guī)模研究的證據(jù)的診斷/預(yù)后評估;
D級:結(jié)果不確定的臨床前研究,可作為輔助標(biāo)志物,基于小規(guī)模研究且未達(dá)成共識。
圖2 基于證據(jù)體細(xì)胞變異分類(臨床影響力)
圖注:
I級:具有強臨床意義的變異(A級和B級證據(jù));
II級:具有潛在臨床意義的變異(C級或D級證據(jù));
III級:變異的臨床意義不確定;
IV級:與良性或疑似良性相關(guān)的變異。
7. 檢測結(jié)果報告與解讀
- 所有檢測到的變異都需要根據(jù)臨床影響力4級分級系統(tǒng)進(jìn)行分級標(biāo)識;
- 所有檢測到的變異都需要按照HUGO基因命名委員會規(guī)則注釋與報告,報告中也應(yīng)包含其他必要信息;
- 生殖系變異在報告中可不加以區(qū)分,若報告生殖系變異需符合當(dāng)?shù)胤膳c政策(患者需簽署知情同意書等);
- 報告檢測到變異的臨床意義;
- 報告可隨相關(guān)醫(yī)學(xué)知識的更新而發(fā)生變化,當(dāng)有特殊需求時可考慮更新報告;
- 實驗方法應(yīng)隨檢測結(jié)果一同報告;
- 可將檢測報告與電子病歷系統(tǒng)整合。
注:
1. NGS分析無法區(qū)分體系變異與生殖系變異;
2. 生殖系變異的報告需要依據(jù)ACMG/AMP指南。
8. 結(jié)論
在癌癥基因組譜中越來越多地使用NGS技術(shù),給臨床實驗室?guī)砹诵碌奶魬?zhàn)。分子專業(yè)人員的關(guān)鍵任務(wù)之一是,基因測序檢測到的癌癥相關(guān)序列變體的解釋和報告的標(biāo)準(zhǔn)化。擬議的“癌癥序列變異解釋與報告標(biāo)準(zhǔn)指南”代表了工作組成員的專家一致意見及他們代表的利益相關(guān)者的意見。該建議描述了一個基于證據(jù)的變量分類系統(tǒng),以及變量注釋,分類和報告的過程。該報告還列出了常用于NGS數(shù)據(jù)分析的有用的生物信息學(xué)工具和數(shù)據(jù)庫。這些建議應(yīng)作為臨床實驗室專業(yè)人員和腫瘤學(xué)家的教育資源,以輔助變體解釋和臨床決策。我們希望本文提供的指南將在癌癥基因組學(xué)領(lǐng)域得到廣泛應(yīng)用,并推動癌癥患者的基因組檢測和正確治療實踐。
9. 免責(zé)聲明
分子病理學(xué)協(xié)會(AMP)臨床實踐指南和報告的開發(fā),旨在為實踐和特定領(lǐng)域的實踐提供指導(dǎo)和建議,幫助實驗室和其他衛(wèi)生保健專業(yè)人員。指南或報告不應(yīng)被視為包括所有正確的方式或方法,或排除其他方式或方法。指南或報告不能高效任何具體結(jié)果,也不能建立一種護(hù)理標(biāo)準(zhǔn)。指南或報告不是要指定對特定患者的治療。治療決定必須基于健康護(hù)理提供者和每個患者的個體情況的獨立判斷。 AMP對本指南或報告不作任何明示或暗示的高效,特別不包括任何對特定用途或目的適銷性或適用性的高效。 AMP對與使用本文所含信息相關(guān)的直接,間接,特殊,偶然或繼發(fā)性損失概不負(fù)責(zé)。
10. 參考資料
http://jmd.amjpathol.org/article/S1525-1578(16)30223-9/fulltext#appsec1
(責(zé)任編輯:佳學(xué)基因)