|
革命性的單細(xì)胞相似性數(shù)據(jù)分析與快速跨組織比較2024-11-28 17:00
在最近發(fā)表在《Nature》雜志上的一項研究中,加拿大和美國的研究人員開發(fā)了單細(xì)胞相似性(Similarity),這是一個快速、可解釋地搜索單細(xì)胞或單核核糖核酸-seq (sc/snRNA-seq)數(shù)據(jù)的框架。這個框架使得在人類細(xì)胞圖譜中發(fā)現(xiàn)相似的細(xì)胞狀態(tài)成為可能。 背景sc/snRNA-seq已經(jīng)在各種條件下分析了超過1億個細(xì)胞,為在發(fā)育、組織和疾病中連接細(xì)胞狀態(tài)提供了前所未有的機(jī)會。然而,由于數(shù)據(jù)集協(xié)調(diào)、定義共享表示、缺乏健壯的相似性度量或可擴(kuò)展的搜索方法等方面的挑戰(zhàn),大規(guī)模分析仍然受到限制。 目前的方法往往不能泛化跨數(shù)據(jù)集,不能有效地查詢大量的圖譜相似的細(xì)胞概況。需要進(jìn)一步的研究來開發(fā)基礎(chǔ)模型,以實現(xiàn)準(zhǔn)確、可擴(kuò)展和可解釋的搜索,釋放單細(xì)胞圖譜的全部潛力,以推進(jìn)生物學(xué)發(fā)現(xiàn)。 scRNA-seq已經(jīng)在各種組織、條件和疾病中分析了數(shù)百萬個單個細(xì)胞,為跨環(huán)境連接細(xì)胞狀態(tài)提供了變革的機(jī)會。然而,數(shù)據(jù)集之間的有效比較仍然有限,因為在協(xié)調(diào)不同數(shù)據(jù)、定義共同表示和制定準(zhǔn)確的度量來量化細(xì)胞相似性方面存在挑戰(zhàn)。 在保留數(shù)據(jù)集特定信息的同時,現(xiàn)有模型通常無法泛化或有效地搜索大型地圖集以獲得可比較的細(xì)胞狀態(tài)。 度量學(xué)習(xí)是一種成功應(yīng)用于圖像處理等領(lǐng)域的技術(shù),它提供了一種很有前途的解決方案。通過將細(xì)胞輪廓嵌入到共享的低維空間中,可以在大量數(shù)據(jù)集中識別生物學(xué)上相似的細(xì)胞。這樣的表示可以在不同的環(huán)境中對細(xì)胞進(jìn)行可擴(kuò)展、可解釋的搜索,促進(jìn)跨數(shù)據(jù)集比較和生物學(xué)發(fā)現(xiàn) 研究結(jié)果相似性證明了不同單細(xì)胞分析平臺的通用性。雖然主要是在10x Genomics Chromium數(shù)據(jù)上進(jìn)行訓(xùn)練,但它可以有效地嵌入和注釋來自多個平臺的細(xì)胞譜,包括scRNA-seq和snRNA-seq數(shù)據(jù)集。 例如,除了傳統(tǒng)樹突狀細(xì)胞(cDCs)和漿細(xì)胞樣樹突狀細(xì)胞(pDCs)等罕見細(xì)胞類型外,在七個平臺上分析的人外周血單個核細(xì)胞(PBMC)樣本顯示出一致的跨平臺注釋精度。 雖然嵌入距離存在微小差異,特別是對于非10倍平臺,如RNA模板測序的5'端切換機(jī)制(SMART-Seq2),但相似性保持了高性能,顯示了其對不同數(shù)據(jù)源的適應(yīng)性。 相似性的一個關(guān)鍵優(yōu)勢是它能夠集成數(shù)據(jù)集,而不需要顯式的批量校正。通過量化單個細(xì)胞的表示置信度,該模型識別異常值并評估其對新數(shù)據(jù)的泛化。例如,低置信度注釋與訓(xùn)練數(shù)據(jù)中表現(xiàn)不佳的組織(如胃和膀胱)相關(guān)。這種能力使得構(gòu)建一個跨越30個人體組織的圖譜和促進(jìn)泛組織比較成為可能。 該模型還通過其基于嵌入的相似性度量在注釋細(xì)胞類型方面表現(xiàn)出色。相似性獨立地注釋單個細(xì)胞,避免了聚類和高效地檢索最相似細(xì)胞的需要。它達(dá)到了與現(xiàn)有方法競爭的準(zhǔn)確性,如使用變分推理(scANVI)和CellTypist的單細(xì)胞注釋,甚至匹配由蛋白質(zhì)標(biāo)記支持的細(xì)粒度注釋。例如,與作者提供的標(biāo)簽相比,相似度正確注釋了健康腎臟樣本中86.5%的細(xì)胞,與組織特異性模型相當(dāng)。 使用集成梯度驗證了相似性的可解釋性,該梯度確定了關(guān)鍵基因?qū)?xì)胞類型注釋的貢獻(xiàn)。這些基因?qū)傩耘c主要細(xì)胞類型的已知標(biāo)記相一致,例如區(qū)分肺泡2型(AT2)細(xì)胞的表面活性劑基因。這證明了相似性在沒有事先了解細(xì)胞類型特異性特征的情況下捕獲生物學(xué)上有意義的特征的能力。 使用纖維化相關(guān)巨噬細(xì)胞(FMΦs)和間質(zhì)性肺疾病(ILD)的肌成纖維細(xì)胞來測試模型的查詢能力。在ILD數(shù)據(jù)集、癌癥和其他纖維化疾病中發(fā)現(xiàn)FMΦ-like細(xì)胞的相似性,揭示了共享的細(xì)胞狀態(tài)。值得注意的是,它在罕見的情況下發(fā)現(xiàn)了FMΦs,例如胰腺導(dǎo)管腺癌(PDAC),這表明它們在纖維化中具有更廣泛的相關(guān)性。 為了進(jìn)一步探索其效用,similarity在體外尋找FMΦ-like細(xì)胞。令人驚訝的是,它發(fā)現(xiàn)在3D水凝膠系統(tǒng)中培養(yǎng)的細(xì)胞在轉(zhuǎn)錄上與FMΦs相似。實驗驗證證實了similarity的預(yù)測,證明了其在體外鑒定新的實驗條件和模擬疾病相關(guān)細(xì)胞狀態(tài)方面的潛力。 總之,相似性通過在不同的scRNA-seq和snRNA-seq數(shù)據(jù)集上進(jìn)行可擴(kuò)展和有效的搜索來推進(jìn)單細(xì)胞分析。 它建立在度量學(xué)習(xí)的基礎(chǔ)上,提供細(xì)胞譜的注釋和查詢,利用完整的表達(dá)譜來減少來自精選基因簽名的偏差。相似性在識別轉(zhuǎn)錄相似的細(xì)胞方面表現(xiàn)出色,有助于發(fā)現(xiàn)新的狀態(tài),如FMΦs和跨疾病的肌成纖維細(xì)胞。 它能夠推廣到未見過的數(shù)據(jù)集,其開源可用性使其成為探索人類細(xì)胞圖譜的基礎(chǔ)工具,支持各種生物研究,并揭示對人類生物學(xué)和疾病機(jī)制的見解。 本網(wǎng)站所有轉(zhuǎn)載文章系出于傳遞更多信息之目的,轉(zhuǎn)載內(nèi)容不代表本站立場。不希望被轉(zhuǎn)載的媒體或個人可與我們聯(lián)系,我們將立即進(jìn)行刪除處理。 下一篇: 胎牛血清中解凍后的絮狀沉淀的原因
|