2017年09月28日 瀏覽次數(shù): 0
近日,清華大學(xué)交叉信息研究院曾堅陽研究組在《細胞》子刊《細胞·系統(tǒng)》(Cell Systems)發(fā)表題為“Analysis of Ribosome Stalling and Translation Elongation Dynamics by Deep Learning”(《利用深度學(xué)習(xí)分析核糖體停滯現(xiàn)象與蛋白質(zhì)翻譯動態(tài)》)的研究論文,首次利用深度學(xué)習(xí)技術(shù)對蛋白質(zhì)翻譯的動態(tài)過程進行建模。該成果也被第21屆國際計算分子生物學(xué)大會(RECOMB 2017)接收,并作為計算生物學(xué)新興研究方向的代表性工作被邀請做大會論文口頭報告。該工作提出了一種全新的基于高通量測序技術(shù)的深度學(xué)習(xí)計算框架,并以此揭示了蛋白質(zhì)翻譯這一基本生物過程的調(diào)控機制。?????
蛋白質(zhì)翻譯是遺傳信息從其攜帶者DNA到執(zhí)行者蛋白質(zhì)傳遞的關(guān)鍵一環(huán),也是分子生物學(xué)中心法則的核心環(huán)節(jié)。在蛋白質(zhì)翻譯的過程中,一種名為核糖體(ribosome)的細胞器會沿著信使RNA鏈,按照遺傳密碼子的對應(yīng)法則依次將核苷酸序列翻譯成氨基酸序列,繼而形成多肽鏈。近年來,生物學(xué)家們通過各種高通量測序技術(shù)測量發(fā)現(xiàn),蛋白質(zhì)翻譯的過程是動態(tài)變化的,其中大量存在一種核糖體翻譯停滯(ribosome stalling)的現(xiàn)象,這一現(xiàn)象與翻譯過程中的蛋白質(zhì)折疊和定位等一系列重要過程有關(guān)。
作為該領(lǐng)域的一項突破性進展,曾堅陽研究組首次提出了一種基于機器學(xué)習(xí)的計算框架來研究核糖體停滯現(xiàn)象的調(diào)控機制和功能,并成功利用深度學(xué)習(xí)技術(shù)實現(xiàn)了對蛋白質(zhì)翻譯過程中核糖體翻譯停滯的精確預(yù)測。傳統(tǒng)的觀點認(rèn)為,mRNA序列信息只是通過密碼子表編碼氨基酸序列,而本工作首次對mRNA序列中編碼蛋白質(zhì)翻譯的調(diào)控信息進行建模。該模型僅以信使RNA的一級序列作為特征輸入,沒有整合其他的生物學(xué)特征。進一步地,研究人員基于深度學(xué)習(xí)自動提取的隱藏特征以及模型精確的預(yù)測結(jié)果,對調(diào)控核糖體翻譯停滯的各種因素以及該現(xiàn)象的生物學(xué)功能進行了系統(tǒng)性的分析,在驗證前人研究成果的同時,提出了許多新的假設(shè),為進一步探究蛋白質(zhì)翻譯的動態(tài)特征打下了堅實的基礎(chǔ)。
國際計算分子生物學(xué)大會(RECOMB)是計算生物學(xué)領(lǐng)域的兩大頂級會議之一,該會議歷年平均錄用率約為20%。 論文共同第一作者為交叉信息研究院博士生張賽(目前在美國斯坦福大學(xué)進行博士后研究)、藥學(xué)實驗班博士生胡海林(目前為醫(yī)學(xué)院在讀博士生)以及本科生周鏡天(目前在美國加州大學(xué)圣地亞哥分校攻讀博士學(xué)位),通訊作者為曾堅陽助理教授。該項工作與美國加州大學(xué)河濱分校的姜濤教授合作完成?!都毎?/span>·系統(tǒng)》(Cell Systems)是隸屬于Cell出版集團新興交叉學(xué)科期刊,其定位于收錄系統(tǒng)生物學(xué)和定量生物學(xué)研究的高水平文章。作為國際知名頂級期刊《細胞》(Cell)的子刊,《細胞·系統(tǒng)》建刊兩年以來,已經(jīng)在國際上取得了相當(dāng)廣泛的影響力。
此外,本文的姊妹工作,TITER: predicting translation initiation sites by deep learning(《TITER: 利用深度學(xué)習(xí)預(yù)測蛋白質(zhì)翻譯起始位點》),已于2017年7月在國際計算生物學(xué)知名期刊《生物信息學(xué)》(Bioinformatics)在線發(fā)表,同時被國際分子生物學(xué)智能系統(tǒng)大會(ISMB 2017)收錄為大會口頭報告。該研究利用深度學(xué)習(xí)技術(shù)預(yù)測轉(zhuǎn)錄組中的翻譯起始位點,首次將預(yù)測范圍擴大到了轉(zhuǎn)錄組中所有種類的翻譯起始位點,并對翻譯起始位置的序列特征、調(diào)控功能、突變效應(yīng)做了深度解析。該項工作共同第一作者為張賽和胡海林同學(xué),并與姜濤教授及醫(yī)學(xué)院公共健康研究中心張磊教授合作完成。這兩項工作的完成為人類解碼蛋白質(zhì)翻譯過程提供了重要信息。
曾堅陽研究組是國內(nèi)較早將深度學(xué)習(xí)應(yīng)用到基因組學(xué)數(shù)據(jù)分析的研究組之一。本系列工作得到中國國家自然科學(xué)基金、美國國家科學(xué)基金會(NSF)和清華大學(xué)結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心的經(jīng)費支持。
相關(guān)論文鏈接:
http://www.cell.com/cell-systems/fulltext/S2405-4712(17)30337-X
https://doi.org/10.1093/bioinformatics/btx247
版權(quán)與免責(zé)聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構(gòu)成其他建議。僅提供交流平臺,不為其版權(quán)負責(zé)。如涉及侵權(quán),請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com