轉(zhuǎn)錄組的復(fù)雜性是高等生物的標(biāo)志性特征,是蛋白質(zhì)組多樣性的主要來(lái)源,同時(shí)也極大擴(kuò)充了非編碼RNA的種類與功能。除經(jīng)典的RNA可變剪接之外,不同基因間的分子融合產(chǎn)生嵌合RNA(chimeric RNA),也是轉(zhuǎn)錄組復(fù)雜性的重要來(lái)源。DNA水平的基因重組與RNA水平的非經(jīng)典剪接事件,包括順、反式剪接(cis-, trans-splicing)以及相鄰基因的轉(zhuǎn)錄 “順讀”(transcription read-through),均導(dǎo)致嵌合RNA的產(chǎn)生。嵌合RNA及其融合蛋白產(chǎn)物是多種癌癥的關(guān)鍵標(biāo)志物及治療靶點(diǎn),在正常細(xì)胞或組織中也發(fā)現(xiàn)了多個(gè)由順、反式剪接或轉(zhuǎn)錄順讀導(dǎo)致的嵌合RNA,表明轉(zhuǎn)錄組多維度的復(fù)雜性具有重要的生物學(xué)與病理學(xué)意義。
近期,清華大學(xué)生命學(xué)院楊雪瑞課題組通過(guò)對(duì)大規(guī)模RNA測(cè)序數(shù)據(jù)的深度挖掘與分析,發(fā)現(xiàn)一類新的RNA嵌合體,即由基因組DNA的雙向轉(zhuǎn)錄產(chǎn)物融合形成的異鏈嵌合RNA,因此將其命名為cross-strand chimeric RNA (cscRNA)。該研究成果于2021年7月30日發(fā)表于《自然通訊》(Nature Communications),論文題目為“雙向轉(zhuǎn)錄產(chǎn)物的融合產(chǎn)生異鏈嵌合RNA”(Identification of the cross-strand chimeric RNAs generated by fusions of bi-directional transcripts),論文鏈接:https://www.nature.com/articles/s41467-021-24910-2
該研究的創(chuàng)意來(lái)源于對(duì)已知RNA融合機(jī)制的總結(jié):RNA順、反式剪接以及相鄰基因的轉(zhuǎn)錄順讀均依賴于兩個(gè)RNA接合位點(diǎn)在空間上的靠近。事實(shí)上,產(chǎn)生環(huán)狀RNA的back-splicing事件也依賴于RNA 5’端與3’端在空間上的靠近。課題組由此推論:在一段基因組區(qū)域內(nèi),分別以DNA雙鏈為模版的雙向轉(zhuǎn)錄產(chǎn)物RNA有很大的窗口在空間上彼此靠近,因此,至少在理論上,兩個(gè)分子間具備了發(fā)生RNA融合,產(chǎn)生異鏈嵌合RNA(cscRNA)的可能性。
cscMap使用RNA雙端測(cè)序數(shù)據(jù)鑒定cscRNA的技術(shù)原理
基于以上假說(shuō),楊雪瑞課題組開(kāi)發(fā)了針對(duì)性的生物信息分析流程cscMap,使用被常規(guī)RNA測(cè)序數(shù)據(jù)比對(duì)流程排除的“垃圾”數(shù)據(jù),系統(tǒng)鑒定異鏈RNA融合事件,準(zhǔn)確發(fā)現(xiàn)cscRNA并排除技術(shù)噪音與潛在的假陽(yáng)性。課題組從ENCODE、GEO等大型數(shù)據(jù)庫(kù)收集了364套高質(zhì)量RNA深度測(cè)序數(shù)據(jù),涉及人、鼠、斑馬魚、線蟲、果蠅、酵母、大腸桿菌等多個(gè)物種,其中人源數(shù)據(jù)近300套,覆蓋正常組織、原代正常細(xì)胞、癌癥細(xì)胞系等各類樣本。cscMap對(duì)以上一系列人類樣本數(shù)據(jù)的掃描發(fā)現(xiàn)了大量cscRNA,其中可靠性高、在多個(gè)樣本中重復(fù)出現(xiàn)的cscRNA約3000個(gè)。在其它物種中,cscMap也發(fā)現(xiàn)大量cscRNA,其在物種間的保守性較差,并且隨著物種生物復(fù)雜度的升高,cscRNA出現(xiàn)頻率呈上升趨勢(shì)。
在人源組織、細(xì)胞及其它物種中發(fā)現(xiàn)的cscRNA數(shù)量
在構(gòu)建了cscRNA的物種與組織特異性數(shù)據(jù)庫(kù)資源后,課題組通過(guò)實(shí)驗(yàn)方法驗(yàn)證了多個(gè)cscRNA在細(xì)胞中真實(shí)存在,且具有潛在的重要生物學(xué)功能,并進(jìn)一步展開(kāi)對(duì)其表達(dá)、來(lái)源等特征的深入分析。正如課題所預(yù)期的,cscRNA主要來(lái)源于RNA水平的分子融合,而不是DNA水平的基因重組。與lncRNA、miRNA等非編碼RNA類似,cscRNA在細(xì)胞中的表達(dá)水平差異較大,具有明顯的組織特異性。
cscRNA在各類人源樣本中呈現(xiàn)組織特異性
從其來(lái)源看,cscRNA多來(lái)源于已注釋基因及其反義鏈DNA的對(duì)向轉(zhuǎn)錄產(chǎn)物,產(chǎn)生cscRNA的兩個(gè)異鏈接合位點(diǎn)在基因組上通常非??拷?0kb之內(nèi))。值得注意的是,cscRNA 3’片段的接合位點(diǎn)高度富集于外顯子5’端上下游非常窄的區(qū)間,但卻往往并不恰好位于5’端。這暗示形成cscRNA的異鏈接合極有可能與pre-mRNA的剪接有關(guān),但并非經(jīng)典的剪接事件,而是可能與剪接過(guò)程的某種異常有關(guān)。
形成cscRNA的異鏈接合位點(diǎn)輕微富集經(jīng)典的剪接受體位點(diǎn)(AG)及供體位點(diǎn)(GT)(左圖),并大量出現(xiàn)于外顯子5’端周邊(右圖)。
總之,該研究對(duì)cscRNA的序列、表達(dá)、來(lái)源、分布等基本特征獲得了比較全面系統(tǒng)的認(rèn)識(shí),通過(guò)對(duì)異鏈嵌合RNA的發(fā)現(xiàn)與解析,為轉(zhuǎn)錄組的高度復(fù)雜性展開(kāi)了新的維度。與此同時(shí),研究成果也引出一系列關(guān)于cscRNA的生成、調(diào)控、功能的待解決問(wèn)題,特別是RNA剪接的復(fù)雜調(diào)控與cscRNA之間的關(guān)系、cscRNA共性或特異性的生物學(xué)功能等。而通過(guò)對(duì)cscRNA一系列特征的深入挖掘,本研究為cscRNA的起源和功能提供了有價(jià)值的信息,獲得了豐富的數(shù)據(jù)資源,奠定了下一步研究的基礎(chǔ)。
清華大學(xué)生命學(xué)院王雨亭博士、鄒沁博士為論文共同第一作者,楊雪瑞為論文通訊作者。課題組其他成員李發(fā)金、趙文溦、徐暉等為本研究做出了重要貢獻(xiàn),鄧海騰課題組為課題提供了質(zhì)譜數(shù)據(jù)分析方面的大力協(xié)助。研究工作得國(guó)家重點(diǎn)研發(fā)計(jì)劃重點(diǎn)專項(xiàng)、國(guó)家自然科學(xué)基金委、清華大學(xué)自主科研項(xiàng)目的資助。國(guó)家蛋白質(zhì)科學(xué)研究(北京)設(shè)施(清華大學(xué)蛋白質(zhì)研究技術(shù)中心)及清華大學(xué)生物醫(yī)學(xué)測(cè)試中心下屬基因測(cè)序與分析平臺(tái)、生物計(jì)算平臺(tái)及細(xì)胞影像平臺(tái)對(duì)本課題各項(xiàng)的分析與實(shí)驗(yàn)提供了大力支持。
論文鏈接:https://www.nature.com/articles/s41467-021-24910-2
版權(quán)與免責(zé)聲明:本網(wǎng)頁(yè)的內(nèi)容由收集互聯(lián)網(wǎng)上公開(kāi)發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點(diǎn)或證實(shí)其真實(shí)性,也不構(gòu)成其他建議。僅提供交流平臺(tái),不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請(qǐng)聯(lián)系我們及時(shí)修改或刪除。郵箱:sales@allpeptide.com