【佳學基因檢測】腋下有味道就是狐臭嗎?基因解碼是怎樣提高狐臭基因檢測的正確性的?
采用匯總統(tǒng)計學數(shù)據(jù),計算狐臭的微效多基因相互作用
佳學基因采用分析表達式,利用多中心匯總統(tǒng)計學數(shù)據(jù)進行狐臭相關(guān)的基因信息分析,以建立基因型與表型的相關(guān)性。下圖展示了匯總統(tǒng)計學分析、常規(guī)GWAS分析以及個體水平PrediXcan的區(qū)別。
GWAS、PrediXcan和S-PrediXcan之間的比較。上半部分是比較GWAS、PrediXcan和Summary PrediXcan。GWAS和PrediXcan均以基因型和表型數(shù)據(jù)作為輸入。GWAS使用模型Y=a+Xlb+?計算Y對Xl的回歸系數(shù),其中Y是表型,Xl是個體SNP劑量。狐臭的分析計算結(jié)果SNP水平上的結(jié)果。相反,PrediXcan首先通過輸入對轉(zhuǎn)組的預測/和注釋結(jié)果。然后計算狐臭表型Y與每個基因表達預測Tg的回歸系數(shù)。計算的結(jié)果是基因表達水平的結(jié)果。Summary PrediXcan使用GWAS的輸出直接計算基因水平關(guān)聯(lián)結(jié)果。本圖表的下半部分顯示了使用匯總統(tǒng)計計算PrediXcan基因水平關(guān)聯(lián)結(jié)果的算法。給出了佳學基因在基因解碼過程中采用的不同輸入數(shù)據(jù)。計算分析得到的基因型與表型關(guān)系進入狐臭基因檢測的報告分析系統(tǒng),形成不同基因的權(quán)重系數(shù)來源。佳學基因的深度人工智能算法通常是以千人基因組計劃數(shù)據(jù)作為概念形成和模型模擬出發(fā)點,通過已知結(jié)論的明確數(shù)據(jù)來檢驗和校正算法,獲得用于計算預測表達水平所需要的方差和協(xié)方差(LD結(jié)構(gòu))系數(shù)。參考集和訓練集值都經(jīng)過預計算整合進人工智能基因解碼系統(tǒng),只需提供基因檢測、測序、分型結(jié)果數(shù)據(jù)集,就可以得出基因信息的破解結(jié)果。
佳學基因解碼研究發(fā)現(xiàn)PrediXcan和S-PrediXcan結(jié)果之間的高度一致性表明,在大多數(shù)情況下,佳學基因及其合作研究機構(gòu)可以使用匯總結(jié)果數(shù)據(jù)而不損害基因型與表型相關(guān)性的檢出和描述能力。在下面的例子中,基因解碼分析了一種人體細胞及兩種人體生理過程(包括狐臭)的PrediXcan和S-PrediXcan Z評分的比較。分析的人群含非洲、東亞和歐洲亞群。在所有情況下,訓練集(其中訓練預測模型)都是歐洲的(DGN Cohort5)。PrediXcan和S-PrediXcan之間的高度相關(guān)性證明了佳學基因所采用的方法對參考數(shù)據(jù)集和研究數(shù)據(jù)集之間匹配與不匹配正確性。盡管匯總法和個體水平法之間的一致性較好,但仍有少數(shù)假陽性結(jié)果,S-PrediXcan比PrediXcan更顯著。這說明了采用S-PrediXcan達到了提高正確度的目的,而盡可能使用緊密匹配的LD信息會進一步提升智能分析結(jié)果。
佳學基因比較PrediXcan和S-PrediXcan采用模擬數(shù)據(jù)和真實難數(shù)據(jù)的結(jié)果。該圖顯示了在不考慮遺傳因素、無假設(shè)下模擬表型任務(wù)要求下的采用PrediXcan算法與S-PrediXcan的比較;細胞內(nèi)在生長力、雙相情感障礙、人體味影響因子的人工智能多因子算法?;虮磉_預測模型基于已發(fā)表的DGN數(shù)據(jù)集。在模擬分析中,采用了探索研究組(GWAS集)和參考集(LD計算集),原始數(shù)據(jù)由來自千人基因組1000基因組項目中的非洲(661)、東亞(504)和歐洲(503)個體基因型分型數(shù)據(jù)組成。當同一研究集用作參考集時,佳學基因可以獲得獲得了高相關(guān)性(確定系數(shù)):r2 > 0.99999. 對于細胞內(nèi)在生長力,研究集是來自1000基因組項目的非洲、亞洲和歐洲各群體的140個個體的子集。參考集與模擬表型相同。對于疾病表型,研究集由英國個體組成,LD計算集是1000基因組項目的歐洲人群子集。
(責任編輯:佳學基因)