【佳學(xué)基因檢測】基因解碼如何使用UCSC/Ensembl數(shù)據(jù)庫進行基因檢測結(jié)果的分析
ANNOVAR 可以選擇處理 UCSC 已知基因注釋或 Ensembl 基因注釋,這兩種注釋都比 RefSeq 更全面,包括許多注釋不良或計算預(yù)測的基因。 下面顯示了使用 UCSC 已知基因注釋變體的示例:
[jiaxuejiyin@genejiedu ~/]$ annotate_variation.pl -out ex1 -build hg19 example/ex1.avinput humandb/ -dbtype knownGene NOTICE: The --geneanno operation is set to ON by default NOTICE: Reading gene annotation from humandb/hg19_knownGene.txt ... Done with 78963 transcripts (including 18502 without coding sequence annotation) for 28495 unique genes NOTICE: Reading FASTA sequences from humandb/hg19_knownGeneMrna.fa ... Done with 45 sequences WARNING: A total of 43 sequences will be ignored due to lack of correct ORF annotation NOTICE: Finished gene-based annotation on 15 genetic variants in example/ex1.avinput NOTICE: Output files were written to ex1.variant_function, ex1.exonic_variant_function
轉(zhuǎn)錄本名稱(在 ex1.exonic_variant_function 文件中)看起來像 uc002eg1.1 等,它們是 UCSC 基因標(biāo)識符。
要使用 Ensembl 基因注釋變體,請使用以下命令。 輸出格式與上面描述的類似。 “ENSG”和“ENST”是注釋基因和轉(zhuǎn)錄本的 Ensembl 標(biāo)識符。
[jiaxuejiyin@genejiedu ~/]$ annotate_variation.pl -out ex1 -build hg19 ex1.hg19.avinput humandb/ -dbtype ensGene
NOTICE: The --geneanno operation is set to ON by default
NOTICE: Reading gene annotation from humandb/hg19_ensGene.txt ... Done with 196501 transcripts (including 101155 without coding sequence annotation) for 57905 unique genes
NOTICE: Reading FASTA sequences from humandb/hg19_ensGeneMrna.fa ... Done with 20 sequences
WARNING: A total of 6780 sequences will be ignored due to lack of correct ORF annotation
NOTICE: Finished gene-based annotation on 15 genetic variants in example/ex1.avinput
NOTICE: Output files were written to ex1.variant_function, ex1.exonic_variant_function
由于輸出僅包含 Ensembl 標(biāo)識符,因此如果想將其翻譯為基因同義詞,可以下載 hg19 的此文件并自行使用兩列文件進行翻譯。
比較來自三個不同基因定義系統(tǒng)的程序消息(“Done with xxxtranscripts for yyy uniquegenes”),可以看到,Ensembl 注釋了人類基因組中賊多數(shù)量的基因,而 RefSeq 注釋了賊少數(shù)量的基因。
基因解碼說明:從技術(shù)上講,RefSeq 基因和 UCSC 基因是基于轉(zhuǎn)錄本的基因定義。 該數(shù)據(jù)庫根據(jù)轉(zhuǎn)錄數(shù)據(jù)建立了基因模型,然后將基因模型同人類基因組序列進行比對。 相比之下,Ensemble Gene 和 Gencode Gene 是基于組裝的基因定義,試圖直接從人類基因組的參考序列構(gòu)建基因的判斷。 這兩個數(shù)據(jù)分析方法從不同的角度出發(fā),試圖做同一件事:將基因測序獲得的DNA序列給矛盾適當(dāng)?shù)幕蛎Q。
然而,這兩種分析方法會產(chǎn)生不同的分析結(jié)果。 例如,RefSeq 通過組裝群體中的轉(zhuǎn)錄數(shù)據(jù)來構(gòu)建基因模型,但參考人類基因組可能有一個等位基因是一個次要等位基因。 在這種情況下,獲得的序列可能無法與基因組 100% 對齊,從而導(dǎo)致基因測序結(jié)果的 FASTA 文件與從全基因組序列(通過將外顯子連接在一起)生成的 FASTA 文件之間存在差異。
由于這些原因,外顯子變異的正確注釋不能依賴于公共數(shù)據(jù)庫中的cDNA序列,而只能基于基因組本身中實際的chr:start-end位點。 為此,基因解碼針對幾個特定基因組構(gòu)建了FASTA序列,基因檢測機構(gòu)可以直接從ANNOVAR網(wǎng)站下載序列; 基因解碼還提供程序 (retrieve_seq_from_fasta.pl) 來為未提供預(yù)構(gòu)建文件的任何其他基因組構(gòu)建 FASTA 序列。
由于這些原因,基因解碼提供的文件中的 FASTA 序列可能與您從 RefSeq 獲得的 FASTA 序列不同。 ANNOVAR 使用的序列是基于特定基因組構(gòu)建和組裝的“理論”序列,但 RefSeq 編譯的 FASTA 序列是來自大型數(shù)據(jù)庫的“觀察到”序列,與特定組裝版本沒有任何關(guān)系。 它們可能具有相同的標(biāo)識符,但它們是不同的東西。
- 上一篇:【佳學(xué)基因檢測】2023年諾貝爾醫(yī)學(xué)獎,授予新冠病毒疫苗技術(shù)創(chuàng)新者!
- 下一篇:【佳學(xué)基因檢測】基因測序結(jié)果如何使用更新的Hg38數(shù)據(jù)庫進行解碼分析
- 【佳學(xué)基因檢測】基因解碼與基因檢測的區(qū)別:科普解析...
- 【佳學(xué)基因檢測】如何通過基因解碼技術(shù)提高腫瘤靶向藥物和遺傳病鑒定的準確性和檢出率...
- 【佳學(xué)基因檢測】多種多樣的基因檢測?...
- 【佳學(xué)基因檢測】人工智能加持下的基因檢測有什么優(yōu)勢?...
- 【佳學(xué)基因檢測】全基因組測序基因檢測(WGS)在臨床應(yīng)用中優(yōu)勢、困難和前景...
- 【佳學(xué)基因檢測】全基因組測序如何率先用于基因解碼生物醫(yī)學(xué)?...
- 【佳學(xué)基因檢測】如何在實體瘤的基因檢測中使用熒光原位雜交技術(shù)?...
- 【佳學(xué)基因檢測】免疫組織化學(xué) (IHC)、顯色原位雜交 (CISH) 和熒光原位雜交 (FISH) 技術(shù)的比較...
- 【佳學(xué)基因檢測】熒光原位雜交(FISH)在實體瘤診斷和個體化治療中的應(yīng)用...
- 【佳學(xué)基因檢測】腫瘤基因檢測為什么要納入正常組織樣本?...
- 【佳學(xué)基因檢測】基因檢測中的連鎖分析:科研服務(wù)...
- 【佳學(xué)基因檢測】心里所想直接以文字顯示! 讀心頭盔問世 可翻譯人類腦電波...
- 【佳學(xué)基因檢測】基因解碼器與生信一體機...
- 【佳學(xué)基因檢測】可以進行基因篩查的新生兒遺傳病種類及其技術(shù)...
- 【佳學(xué)基因檢測】人類表型數(shù)據(jù)庫(簡稱HPO)...
- 【佳學(xué)基因檢測】基因解碼基因檢測如何構(gòu)建專屬數(shù)據(jù)庫以增加正確性和檢出率...
- 【佳學(xué)基因檢測】基因測序結(jié)果如何通過GENECODE/CCDS進行解碼檢測...
- 【佳學(xué)基因檢測】基因測序結(jié)果如何使用更新的Hg38數(shù)據(jù)庫進行解碼分析...
- 【佳學(xué)基因檢測】基因解碼如何使用UCSC/Ensembl數(shù)據(jù)庫進行基因檢測結(jié)果的分析...
- 【佳學(xué)基因檢測】2023年諾貝爾醫(yī)學(xué)獎,授予新冠病毒疫苗技術(shù)創(chuàng)新者!...
- 【佳學(xué)基因檢測】非小細胞肺癌生物標(biāo)志物的檢測方法或技術(shù)...
- 【佳學(xué)基因檢測】人體細胞年輕態(tài)的基因檢測與評價方法...
- 【佳學(xué)基因檢測】端粒長度與干細胞衰老基因檢測...
- 【佳學(xué)基因檢測】基因解碼技術(shù)成份之基因型填充:Genotype Imputation...
- 【佳學(xué)基因檢測】基因突變對疾病發(fā)生的影響分析:GWAS分析的技術(shù)...
- 【佳學(xué)基因檢測】肺癌靶向藥物塞普替尼selpercatinib (Retevmo)基因檢測...
- 【佳學(xué)基因檢測】LINUX文本文件的各種替代形式...
- 【佳學(xué)基因檢測】如何從基因組序列文件中獲取特定基因的全部序列、編碼序列、啟動子序列?...
- 【佳學(xué)基因檢測】如何貯存用于基因序列比對的全部基因組序列?...
- 【佳學(xué)基因檢測】基因解碼如何構(gòu)建人的標(biāo)準基因序列數(shù)據(jù)庫的?...
- 來了,就說兩句!
-
- 最新評論 進入詳細評論頁>>