近日,中國科學院廣州生物醫藥與健康研究院王杰課題組開發了新的計算工具CACIMAR(Cross-species Analysis of Cell Identities,Markers,Regulations),用于分析跨物種單細胞轉錄組測序數據(scRNA-seq),揭示物種間細胞類型、標志基因、細胞內調控以及細胞間相互作用的進化保守性。相關成果以“CACIMAR: cross-species analysis of cell identities,markers,regulations,and interactions using single-cell RNA sequencing data”為題目發表在學術期刊Briefings in Bioinformatics上。
物種不僅在基因層面,也在細胞類型、基因表達、基因調控、細胞間相互作用等方面顯示出進化保守性。單細胞轉錄組測序技術已廣泛用于不同物種的單細胞表達研究,為在細胞類型水平研究物種的進化保守性提供了新機會。已有的算法能通過分析跨物種單細胞轉錄組數據識別進化保守的細胞類型,如Seurat和SAMap等。但是,這些方法主要通過跨物種的單細胞聚類確定保守細胞類型,其準確性在很大程度上取決于跨物種批次效應校正的能力。這些軟件對進化距離較遠物種進行聚類分析,仍存在明顯不足。此外,目前仍沒有方法能確定細胞間相互作用的進化保守性。
針對以上問題,我院王杰課題組開發了新的R軟件包CACIMAR,用于分析跨物種的單細胞轉錄組數據。CACIMAR的保守性分析主要包含三個步驟(圖1)。第一步,CACIMAR基于每個物種內的單細胞聚類結果確定每個物種的細胞類型、標志基因、細胞內調控和細胞間相互作用。該策略不用進行跨物種的單細胞聚類,有效避免了跨物種的批次效應。第二步,基于標志基因的統計值(statistical power)和物種同源性(homolog),CACIMAR計算細胞類型的保守性分值。此外,CACIMAR還建立了特征加權和的模型(weighted sum?model),分別計算細胞內調控網絡的保守性分值和細胞間相互作用的保守性分值。最后一步,基于計算的不同保守性分值分別確定跨物種保守或特異的細胞類型、細胞內調控和細胞間相互作用。該研究將CACIMAR應用于小鼠、斑馬魚和小雞的視網膜損傷再生的公共單細胞轉錄組數據中,有效地確定了小鼠、斑馬魚和小雞視網膜中保守的細胞類型、標志基因、細胞內調控和細胞間相互作用。
總體上,CACIMAR提供了一種新的算法,能克服現有跨物種單細胞轉錄組數據分析的挑戰,特別是在識別跨物種保守和特異的細胞類型、基因調控以及細胞間相互作用方面。通過該算法,研究人員能深入地分析不同物種的細胞和分子水平的進化保守性,為理解物種進化的機制提供了新的視角。
廣州健康院的王杰研究員和徐雪麗助理研究員為本論文的共同通訊作者,蔣俊堯和李金連為論文的共同第一作者。該研究得到了國家自然科學基金、國家重點研發計劃、廣東省自然科學基金等項目的資助。
圖1?CACIMAR進行跨物種單細胞轉錄組數據分析示意圖
附件下載: