2021年02月02日 瀏覽次數(shù): 0
? ? ? ?近日,清華大學交叉信息研究院的曾堅陽研究組成功開發(fā)了能在全基因組上預測RNA聚合酶暫停位點的深度神經網絡模型,該研究為Pol II暫?,F(xiàn)象在轉錄過程中的調控機制提供了一個全新的分析框架,也為在缺乏測序數(shù)據的細胞系上研究Pol II暫停提供了很好的預測參考模型。相關成果《基于機器學習框架的轉錄延伸建模》(A machine learning based framework for modeling transcription elongation) 于2月1日 在《美國國家科學院院刊》(Proceedings of the National Academy of Sciences of the United States of America)上發(fā)表。
? ? ? 真核生物的轉錄是一個高度復雜且被準確調控的動態(tài)過程,RNA聚合酶 II (RNA polymerase II, Pol II) 作為轉錄過程(特別是轉錄延伸階段)的核心分子成員,對遺傳信息的傳遞起著關鍵作用。研究表明,在轉錄延伸過程中,普遍存在Pol II暫停(Pol II pausing)現(xiàn)象,其參與下游基因的表達調控、影響基因可變剪切的發(fā)生,與細胞分化、發(fā)育等生命活動息息相關。目前,Pol II暫停相關的轉錄調控機制研究主要依賴于NET-seq(Native elongating transcript sequencing)等高通量測序技術,成本高、需要一定實驗周期。因此,如何實現(xiàn)在全基因組水平上快速、高效的分析Pol II 暫停的偏好位點及其序列特征,以及其與相關轉錄因子間的關系,是轉錄調控領域亟待解決的技術難點。為了解決這一問題,來自清華大學的曾堅陽/趙誕團隊采用基于注意力機制(attention mechanism)的卷積神經網絡對全基因組上的Pol II暫停位點進行預測。在NET-seq數(shù)據集上,其預測準確率均顯著優(yōu)于現(xiàn)有機器學習模型。此外,研究組通過分析模型的注意力機制以及分析模型在基因組上特定位點的預測值,進一步探索了Pol II暫停的生物學特征以及和其他轉錄調控機制的關系,包括:
1. 發(fā)現(xiàn)了決定Pol II暫停的序列特征以及其與暫停位點的關系。
2. 通過分析不同可變剪切方式位點上Pol II的暫停傾向,提供了Pol II影響可變剪切的可能生物學機制。
3. 全面分析了Pol II與轉錄因子、組蛋白修飾、DNA甲基化發(fā)生的相關性。
4. 發(fā)現(xiàn)模型能夠很好的彌補測序數(shù)據深度不足帶來的缺陷。
?
?
Pol II暫停分析預測框架圖
? ? ? 該論文通訊作者為清華大學交叉信息研究院的曾堅陽副教授和趙誕助理研究員,第一作者為清華大學交叉信息研究院2016級博士研究生馮沛源和2016級碩士研究生肖安。此項研究工作獲得國家自然科學基金、南京圖靈人工智能研究院和中關村海華前沿信息技術研究院支持。
論文鏈接:https://www.pnas.org/content/118/6/e2007450118
版權與免責聲明:本網頁的內容由收集互聯(lián)網上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構成其他建議。僅提供交流平臺,不為其版權負責。如涉及侵權,請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com