|
交叉應用 | 長讀長Isoform測序+靶向質譜策略提供了新肽預測方法2024-06-05 16:14
長讀長的轉錄本測序已被證明可以在單核苷酸水平上直接測定轉錄異構體,并將其作為蛋白質的前體,經(jīng)開放閱讀框(ORF)預測,隨后編譯成潛在的全長蛋白質異構體序列(該方法研究人員稱之為長讀長蛋白質基因組學/LRP)。但受限于技術,多數(shù)在蛋白質水平上仍未得到證明。一是異構體往往豐度較低,缺乏獨特的定位肽,并伴隨進化過程的突變,在剪接連接上產(chǎn)生較少的蛋白型胰蛋白酶肽段。二是技術上采用質譜分析蛋白質基因組學,肽的采樣不是直接的,而是半隨機的,其中使用DDA或DIA模式會優(yōu)先采樣最豐富的肽質譜分析(MS1)峰。由于參考蛋白質數(shù)據(jù)庫的不完善,許多蛋白質異構體仍然是未知的。 最近,一項稱為內(nèi)標平行反應監(jiān)測(internal standard parallel reaction monitoring, IS-PRM)的靶向質譜策略已經(jīng)證明了可對感興趣的肽進行多重且靈敏的檢測。但這種方法尚未用于確認新肽的存在。 在“IS-PRM-based peptide targeting informed by long-read sequencing for alternative proteome detection”這項研究中,研究人員**展示了從蛋白質基因組工作流程中大規(guī)模靶向檢測預測肽的方法,稱為LRP-IS-PRM。與質譜DDA模式相比,該策略將同種異構體的可檢測性提高了3.6倍,并鑒定出5種以前未注釋的同種異構體,為異構體提供了蛋白水平的證據(jù)。 結果與分析 1 基于人類細胞系建立蛋白異構體混合物分析標準 首先,研究人員選定誘導多能細胞系WTC11作為復雜基質背景下確定蛋白異構體混合物分析標準的模型系統(tǒng),使用細胞系進行長讀長RNA測序和MS實驗,深入了解樣品特異性轉錄組和預測蛋白質組。蛋白質異構體及其相關的WTC11異構體特異性肽的選擇過程如圖1A所示。 用LRP方法(Sequel II平臺)對WTC11的轉錄組進行了表征,并預測了異構體水平的蛋白組(圖1A)。在WTC11樣本中,研究人員預測了來自11,755個基因的40,846個蛋白質編碼異構體,平均每個基因存在3.5個異構體。并且經(jīng)SQANTI Protein評估,有24,648個(56%)蛋白質編碼異構體是新發(fā)現(xiàn)的。經(jīng)圖1A流程選擇的肽被命名為AS192肽,由192個肽組成,對應55個基因,具有一個主要的異構體和至少一個次要的異構體。 2 Tomahto可提高異構體特異性肽的檢出率 研究人員建立了Tomahto(一種IS-PRM)作為檢測先前觀察到的靶肽的工具后,應用Tomahto檢測WTC11樣品中的異構體特異性肽(內(nèi)源性AS192肽)。實驗流程如圖1B所示:將超重型TMTpro(shTMTpro)標記的AS192合成觸發(fā)肽加入TMTpro標記的WTC11肽消化液中,將樣品分為不分離及高ph值下分離成8個部分兩種類型(各3個重復,圖2D)。 利用Tomahto CID對分離的WTC11樣品進行分析,鑒定出192個AS192靶肽中的65個,是DDA HCD鑒定數(shù)目(21個肽)的3倍。另外,在未分離和分離的WTC11肽樣品中以及在不同的片段化模式下,Tomahto都返回了更高數(shù)量的確認肽鑒定(圖3A)。WTC11中主要和次要蛋白質同種異構體檢測結果如圖3B所示。根據(jù)定義,與主要異構體相比,次要異構體的轉錄物豐度較低,理論上分析鑒定更具挑戰(zhàn)性。值得注意的是,研究人員通過MS2采集掃描檢測觸發(fā)肽(而非MS1信號)檢測到一種內(nèi)源性的異構體特異性肽(缺乏MS1信號):EQPGSYSDAPEYLWSGTL(見圖3B箭頭)。觸發(fā)點和靶點對應的MS1譜圖和MS2碎片圖如圖3C所示,這增加了檢測低豐度肽的靈敏度,這對于檢測低豐度次要異構體至關重要。 3 長讀長測序提供了對蛋白質異構體表達的深入了解 為了標注檢測到的肽支持的異構體,研究人員創(chuàng)建了一個UCSC基因組瀏覽器track63來可視化RNA轉錄本、它們的預測蛋白和相關的異構體特異性肽,提供多肽鑒定的基因組和可變剪接背景(圖4)。值得注意的是,研究人員捕獲了與AP1S2、ARFIP1、CIRBP、ASB6、CHTF8、LTA4H、NUP50、FBXL15、SF3B1和FBXO44基因對應的主要和次要異構體特異性肽對(表1)。除ARFIP1和AP1S2外,所有主要和次要異構體對都是僅可經(jīng)Tomahto鑒定。特別的是,從基因SF3B1中發(fā)現(xiàn)了一個編碼剪接體核心復合體的**亞基的異構體,介導選擇性剪接(圖4B)。SF3B1突變發(fā)生在惡性腫瘤中與不良患者預后相關,因此SF3B1突變蛋白可能作為患者的生物標志物,這使得檢測SF3B1的特異性異構體十分重要。綜上,通過使用Tomahto等方法,研究人員可以確認在病理或生理狀態(tài)下剪接變化引起的穩(wěn)定表達的同種異構體。 此外,研究人員從以前未注釋的異構體中檢測到5個肽,定義為在WTC11蛋白質組中發(fā)現(xiàn),但在GENCODE v42參考蛋白質組中未注釋(表1)。其中,C1orf52是一個未被充分研究的蛋白質編碼基因,其變異與多發(fā)性硬化癥的風險有關(圖4C)。C1orf52已被確定為一種RNA結合蛋白,在調(diào)節(jié)基因表達中起關鍵作用,這些蛋白的突變與許多疾病有關。 最后,研究人員評估了質譜檢測AS192目標肽的能力,研究人員交叉檢查了UCSD MassIVE (https://massive.ucsd.edu)和PeptideAtlas68質譜數(shù)據(jù)庫,以尋找在之前的蛋白質組學實驗中觀察到AS192肽的證據(jù)。共有141個AS192多肽有先前MS觀察的證據(jù),而51個在這些數(shù)據(jù)庫中缺失(表2)。研究人員檢測到8種以前未檢測到的肽,包括來自SF3B1的次要異構體特異性肽(表1)。檢測到以前未注釋的異構體和肽,這些未在質譜數(shù)據(jù)庫中報道,突出了將長讀長測序信息預測的蛋白質數(shù)據(jù)庫與靶向質譜相結合的能力。 討論與展望 通過將長讀長蛋白質基因組學與內(nèi)標平行反應監(jiān)測(LRP-IS-PRM)相結合,研究人員可以系統(tǒng)地探索不同條件下的可變蛋白質組。例如,廣泛存在于從細胞分化到癌癥的各種生理和病理狀態(tài)中的異構體轉換。通過利用LRP-IS-PRM,這些差異剪接事件可以在更大范圍內(nèi)的蛋白質異構體水平上進行量化。這項研究**成功地將蛋白質基因組學方法與基于觸發(fā)器的肽靶向軟件Tomahto結合起來以表征可變蛋白質組。 PacBio HiFi測序系統(tǒng) HiFi測序讀長能達到10-25 kb,準確度也在Q30(99.9%)以上,Iso-seq方法可提供全長轉錄本異構體,無需組裝即可表征轉錄組的完整多樣性,探索不同剪接機制生成的不同異構體是如何導致健康和疾病間的表型差異: ü 發(fā)現(xiàn)可變起始位點和終止位點,檢測可變多聚腺苷化 ü 揭示復雜可變剪接、融合事件以及轉錄通讀 ü 鑒定等位基因特異性異構體 PacBio推出了Kinnex試劑盒!!! Kinnex試劑盒基于MAS-Seq方法,可將較小的DNA片段連接成較長的HiFi可用文庫,提高測序通量,使長讀長 RNA -seq更具成本效益。 Kinnex 單細胞RNA試劑盒以現(xiàn)有的 MAS-Seq for Single Cell 3'試劑盒為基礎,增加了對 10x Genomics 5'試劑盒和文庫復用的額外支持。可使測序通量提高16倍,獲得基因表達及全長isoform信息,在單細胞水平上揭示RNA異構體多樣性。 ü Kinnex 全長RNA試劑盒可進行全長RNA 測序,與典型的Iso-seq文庫相比,其通量提高了8倍,可實現(xiàn)從5'端到3'端全長異構體測序,準確表征剪接位點,發(fā)現(xiàn)新基因和新異構體,鑒定融合基因,并獲得基因及異構體read計數(shù)信息進而分析表達量。
本網(wǎng)站所有轉載文章系出于傳遞更多信息之目的,轉載內(nèi)容不代表本站立場。不希望被轉載的媒體或個人可與我們聯(lián)系,我們將立即進行刪除處理。 上一篇: PCR實驗室如何避免樣本污染
|