|
革命性的單細胞相似性數據分析與快速跨組織比較2024-11-28 17:00
在最近發表在《Nature》雜志上的一項研究中,加拿大和美國的研究人員開發了單細胞相似性(Similarity),這是一個快速、可解釋地搜索單細胞或單核核糖核酸-seq (sc/snRNA-seq)數據的框架。這個框架使得在人類細胞圖譜中發現相似的細胞狀態成為可能。 背景sc/snRNA-seq已經在各種條件下分析了超過1億個細胞,為在發育、組織和疾病中連接細胞狀態提供了前所未有的機會。然而,由于數據集協調、定義共享表示、缺乏健壯的相似性度量或可擴展的搜索方法等方面的挑戰,大規模分析仍然受到限制。 目前的方法往往不能泛化跨數據集,不能有效地查詢大量的圖譜相似的細胞概況。需要進一步的研究來開發基礎模型,以實現準確、可擴展和可解釋的搜索,釋放單細胞圖譜的全部潛力,以推進生物學發現。 scRNA-seq已經在各種組織、條件和疾病中分析了數百萬個單個細胞,為跨環境連接細胞狀態提供了變革的機會。然而,數據集之間的有效比較仍然有限,因為在協調不同數據、定義共同表示和制定準確的度量來量化細胞相似性方面存在挑戰。 在保留數據集特定信息的同時,現有模型通常無法泛化或有效地搜索大型地圖集以獲得可比較的細胞狀態。 度量學習是一種成功應用于圖像處理等領域的技術,它提供了一種很有前途的解決方案。通過將細胞輪廓嵌入到共享的低維空間中,可以在大量數據集中識別生物學上相似的細胞。這樣的表示可以在不同的環境中對細胞進行可擴展、可解釋的搜索,促進跨數據集比較和生物學發現 研究結果相似性證明了不同單細胞分析平臺的通用性。雖然主要是在10x Genomics Chromium數據上進行訓練,但它可以有效地嵌入和注釋來自多個平臺的細胞譜,包括scRNA-seq和snRNA-seq數據集。 例如,除了傳統樹突狀細胞(cDCs)和漿細胞樣樹突狀細胞(pDCs)等罕見細胞類型外,在七個平臺上分析的人外周血單個核細胞(PBMC)樣本顯示出一致的跨平臺注釋精度。 雖然嵌入距離存在微小差異,特別是對于非10倍平臺,如RNA模板測序的5'端切換機制(SMART-Seq2),但相似性保持了高性能,顯示了其對不同數據源的適應性。 相似性的一個關鍵優勢是它能夠集成數據集,而不需要顯式的批量校正。通過量化單個細胞的表示置信度,該模型識別異常值并評估其對新數據的泛化。例如,低置信度注釋與訓練數據中表現不佳的組織(如胃和膀胱)相關。這種能力使得構建一個跨越30個人體組織的圖譜和促進泛組織比較成為可能。 該模型還通過其基于嵌入的相似性度量在注釋細胞類型方面表現出色。相似性獨立地注釋單個細胞,避免了聚類和高效地檢索最相似細胞的需要。它達到了與現有方法競爭的準確性,如使用變分推理(scANVI)和CellTypist的單細胞注釋,甚至匹配由蛋白質標記支持的細粒度注釋。例如,與作者提供的標簽相比,相似度正確注釋了健康腎臟樣本中86.5%的細胞,與組織特異性模型相當。 使用集成梯度驗證了相似性的可解釋性,該梯度確定了關鍵基因對細胞類型注釋的貢獻。這些基因屬性與主要細胞類型的已知標記相一致,例如區分肺泡2型(AT2)細胞的表面活性劑基因。這證明了相似性在沒有事先了解細胞類型特異性特征的情況下捕獲生物學上有意義的特征的能力。 使用纖維化相關巨噬細胞(FMΦs)和間質性肺疾病(ILD)的肌成纖維細胞來測試模型的查詢能力。在ILD數據集、癌癥和其他纖維化疾病中發現FMΦ-like細胞的相似性,揭示了共享的細胞狀態。值得注意的是,它在罕見的情況下發現了FMΦs,例如胰腺導管腺癌(PDAC),這表明它們在纖維化中具有更廣泛的相關性。 為了進一步探索其效用,similarity在體外尋找FMΦ-like細胞。令人驚訝的是,它發現在3D水凝膠系統中培養的細胞在轉錄上與FMΦs相似。實驗驗證證實了similarity的預測,證明了其在體外鑒定新的實驗條件和模擬疾病相關細胞狀態方面的潛力。 總之,相似性通過在不同的scRNA-seq和snRNA-seq數據集上進行可擴展和有效的搜索來推進單細胞分析。 它建立在度量學習的基礎上,提供細胞譜的注釋和查詢,利用完整的表達譜來減少來自精選基因簽名的偏差。相似性在識別轉錄相似的細胞方面表現出色,有助于發現新的狀態,如FMΦs和跨疾病的肌成纖維細胞。 它能夠推廣到未見過的數據集,其開源可用性使其成為探索人類細胞圖譜的基礎工具,支持各種生物研究,并揭示對人類生物學和疾病機制的見解。 本網站所有轉載文章系出于傳遞更多信息之目的,轉載內容不代表本站立場。不希望被轉載的媒體或個人可與我們聯系,我們將立即進行刪除處理。 上一篇: 胎牛血清的顏色對細胞培養效果的影響
下一篇: 胎牛血清中解凍后的絮狀沉淀的原因
|