【佳學基因檢測】scRNAseq在基因解碼、基因檢測中的作用
scRNAseq導讀
scRNAseq是一種基因解碼技術(shù),其主要作用在于可以揭示過去被認為是單一生理過程、單一組織的異質(zhì)性。佳學基因等基因信息分析機構(gòu)利用單細胞測序可以將人體基因序列的變化與人體的發(fā)育過程、生理過程和病理過程的調(diào)節(jié)方式和調(diào)節(jié)途徑的揭示。是否采用了單細胞測序結(jié)果用于指導致病基因的鑒定是基因解碼與基因檢測的又一個本質(zhì)區(qū)別。
單細胞測序可以揭示哪些基因檢測不能提供的結(jié)果?
人類各種組織之間細胞的類型,狀態(tài)和相互作用差異巨大。而單細胞RNA測序(snRNA-seq)技術(shù)提供了在單細胞水平觀測基因表達的方法,可以更好地研究這些組織及其中存在的不同類型的細胞。
這一先進且激動人心的技術(shù)可被用于:
研究一個組織中到底存在哪些種類的細胞
識別未知或少見的細胞類型或狀態(tài)
闡明在分化過程或時間及狀態(tài)變化中基因表達的改變
找出在不同條件下(如加藥組和疾病組)在某一特定類型的細胞中差異表達的基因
探究一種細胞類型之間基因表達的變化,同時納入空間,調(diào)控和/或蛋白質(zhì)信息
單細胞測序中解決一些較常見問題的方法包括:
單細胞RNA測序分析中面臨的挑戰(zhàn)
在單細胞RNA測序(scRNA-seq)出現(xiàn)之前,轉(zhuǎn)錄組分析是使用批量RNA測序(bulk RNA-seq)進行的,這是一種比較細胞基因表達平均值 (averages of cellular expression)的直接方法。如果要尋找疾病的生物學標志物 (disease biomarkers),或者不關(guān)心樣本中的細胞異質(zhì)性,這可能是賊好的方法。
雖然批量RNA測序可以探索不同條件(如加藥或疾病)之間基因表達的差異,但在細胞水平上的差異并沒有被充分挖掘。例如,在下圖的展示中,如果進行批量(bulk)分析(左),我們將無法檢測到基因A和基因B表達之間的正確關(guān)系。但是,如果我們按照細胞類型或細胞狀態(tài)對細胞進行適當分群,我們可以看到基因之間的正確關(guān)系。
探究異質(zhì)性 (Studying heterogeneity)
譜系路徑分析 (Lineage tracing study)
隨機基因表達研究 (Stochastic gene expression study)
盡管單細胞RNA測序能夠獲得在細胞水平上的基因表達,但樣本制備和建庫成本更高,分析也更復雜,更難解讀。單細胞RNA測序分析的復雜性包括:
數(shù)據(jù)量巨大
每個細胞測序深度低
跨細胞/樣本的生物學誤差
跨細胞/樣本的技術(shù)性誤差
數(shù)據(jù)量巨大
單細胞RNA測序項目的表達量數(shù)據(jù)代表了成千上萬個細胞中上萬或數(shù)十萬條讀取 (reads),產(chǎn)生的數(shù)據(jù)要大得多,需要更多的內(nèi)存來分析,更大的硬盤來存儲,以及更多的時間來運行分析。
每個細胞測序深度低
對于基于油滴(droplet)的單細胞RNA測序方法,測序的深度較淺,通常每個細胞只能檢測到10-50%的轉(zhuǎn)錄組。這導致細胞中許多基因顯示為零計數(shù)。然而,在一個特定的細胞中,一個基因的零計數(shù)可能意味著該基因沒有被表達,或者只是沒有檢測到轉(zhuǎn)錄本。在細胞中,表達水平較高的基因往往具有較少的零計數(shù)。由于這一特性,許多基因在任何細胞中都不會被檢測到,細胞間的基因表達也會有很大的差異。
跨細胞/樣本的生物學誤差
我們不感興趣的生物學變異會導致細胞間的基因表達跟實際的生物細胞類型或狀態(tài)更為相似或不同,從而影響細胞類型的識別。這些生物學變異(除非是實驗研究的一部分)包括:
轉(zhuǎn)錄脈沖 (Transcriptional Bursting):并非所有基因的基因轉(zhuǎn)錄都處于開啟狀態(tài)。捕獲時間點將決定每個細胞中的基因是打開還是關(guān)閉狀態(tài)。
RNA加工的不同速度 (Varying rates of RNA processing):不同的RNA以不同的速率進行加工。
連續(xù)或離散的細胞特征 (Continuous or discrete cell identities):例如單個T細胞的促炎癥潛能。連續(xù)的表型通過基因表達上的變化來定義,有時很難區(qū)分表型是連續(xù)的,還是離散的。
環(huán)境刺激 (Environmental stimuli):細胞的周邊環(huán)境可以通過空間位置、信號分子等方式影響基因的表達。
時序改變 (Temporal changes):基本的細胞時序變化過程,例如細胞周期,可以影響單個細胞的基因表達譜。
跨細胞/樣本的技術(shù)性誤差
技術(shù)來源的變異會導致細胞間的基因表達因技術(shù)來源而變得更相似/不同,而不是細胞類型/狀態(tài),這會影響細胞類型的識別。技術(shù)來源的變異包括:
不同細胞的捕獲效率 (Cell-specific capture efficiency):不同細胞捕獲的轉(zhuǎn)錄本數(shù)量不同,導致測序深度不同(例如,轉(zhuǎn)錄組的10-50%)。
文庫質(zhì)量 (Library quality):降解的RNA、低活性/瀕死的細胞、大量游離的RNA、分離不好的細胞以及細胞定量不正確都會導致測序質(zhì)量過低。
擴增偏差 (Amplification bias):在建庫(library preparation)的擴增步驟中,并非所有的轉(zhuǎn)錄本都被擴增到相同的水平。
批次差異 (Batch effects):批次問題是單細胞RNA分析中的一個重要問題,因此你可以看到由于批次問題而導致的基因表達上的顯著差異。
如何知道你是否有批次問題?
所有的RNA提取都是在同一天進行的嗎?
所有的建庫工作都是在同一天進行的嗎?
所有樣品的RNA提取或建庫是否由同一個人完成?
你是否對所有樣品都使用了相同的試劑?
你是否在同一地點進行了RNA的提取或建庫?
如果這些答案中有一個是“不”,那么你就有批次問題。
有關(guān)批次問題的賊佳實踐
在實驗設(shè)計中盡可能地避免產(chǎn)生批次
如果無法避免批次:
不要混淆不同批次的實驗
請在不同批次中做不同類別樣品的重復(replicates)。如果是想找出不同處理條件下的差異基因或者在群體水平上下結(jié)論,重復自然越多越好(當然要大于2)。如果使用一次實驗只建庫一次的inDrops方法,則應替換樣本組(例如,不要先建所有疾病組的文庫,然后再建所有治療組的文庫)。
總結(jié)
雖然單細胞RNA測序是一種強大而深刻的從單細胞水平分析基因表達的方法,但由于存在許多挑戰(zhàn)和變異因素,單細胞轉(zhuǎn)錄組的數(shù)據(jù)分析顯得復雜且受限。
綜上所述,我們提出以下建議:
除非對解決我們感興趣的科學問題有必要,否則不要進行單細胞RNA測序。你是否能夠使用更簡單,更廉價的批量RNA測序解決你的科學問題?也許可以使用流式細胞儀(FACS)對樣本進行分選,以便進行批量分析?
了解你想解決的科學問題的各種細節(jié)。推薦的建庫方法和分析流程可以根據(jù)具體實驗而有所不同。
盡可能地避免技術(shù)來源的差異:
實驗開始前與專家討論實驗設(shè)計
同時從樣品中提取RNA
同時建庫或替換樣本組以避免批次混淆
不要混淆不同性別、年齡和批次的樣本組