【佳學(xué)基因檢測】如何用snpSIFT對基因突變進(jìn)行注釋以獲得基因檢測結(jié)果
基因突變的正確注釋培訓(xùn):
人類基因信息的應(yīng)用有兩個不同的層級,一個是基于數(shù)據(jù)庫的結(jié)果比對方法,一個是基于知識發(fā)現(xiàn)的基因解碼方法。為了促進(jìn)更為先進(jìn)的基因解碼技術(shù)的使用。佳學(xué)基因開展了系列培訓(xùn)工作,在理解和使用數(shù)據(jù)庫的基礎(chǔ)上,掌握和學(xué)習(xí)基本基因解碼技術(shù)。
具體用法:
java -jar ~/anaconda3/share/snpsift-4.3.1t-3/SnpSift.jar annotate -v /media/jiaxue/0B8B16F90B8B16F9/wgs/data/resources_broad_hg38_v0_Homo_sapiens_assembly38.dbsnp138.vcf /media/jiaxue/0B8B16F90B8B16F9/wgs/data/RR25119mem-pe.snp.snpeff.vcf > /media/jiaxue/0B8B16F90B8B16F9/wgs/data/sna_ann_file.vcf
在這里,SnpSift是一個JAVA程序,需要使用JAVA -JAR來調(diào)用JAVA運行環(huán)境。SnpSift.jar 是佳學(xué)基因為基因檢測、基因解碼學(xué)員及學(xué)員單位推薦使用的單核酸多態(tài)性的發(fā)現(xiàn)、標(biāo)記和結(jié)果輸出軟件。這是一個開源的軟件,適合沒有軟件開發(fā)能力的中小基因檢測機(jī)構(gòu)學(xué)習(xí)使用。 在使用SnpSift這個軟件時,需要指明該軟件存在的目錄。如果是采用Anaconda3、Conda命令安裝的,這一軟件存在于Anaconda3下面的Share目錄下的snpsift-4.3.1t子目錄。不同的人可能有不同的目錄名稱。定位到這一個特定的Jar文件,才能正確的調(diào)用程序。
annotate 指定我們要采用SnpSift進(jìn)行注釋。
-v 用來指定數(shù)據(jù)庫的版本和來源。 /media/jiaxue/0B8B16F90B8B16F9/wgs/data/resources_broad_hg38_v0_Homo_sapiens_assembly38.dbsnp138.vcf是此次比對、注釋所采用的SNP數(shù)據(jù)庫文件。它可以存在基因檢測深度人工智能分析學(xué)員中的個人指定的文件夾里。前面一部分是文件夾的各級目錄名稱。后一部分是數(shù)據(jù)庫文件名。
/media/jiaxue/0B8B16F90B8B16F9/wgs/data/RR25119mem-pe.snp.snpeff.vcf是參與佳學(xué)基因培訓(xùn)的學(xué)員所分析高通量NGS測序的原始數(shù)據(jù)經(jīng)過比對后獲得的變異位點坐標(biāo)信息。
> 在這里指定結(jié)查輸出參數(shù)。
/media/jiaxue/0B8B16F90B8B16F9/wgs/data/sna_ann_file.vcf是高通量NGS新一代測序后的SNP注釋結(jié)果存放文件。