近些年,各類高通量組學及結構數(shù)據(jù)的快速積累為利用生物信息學解析蛋白質功能背后的序列和結構信息基礎積累了完備的數(shù)據(jù)資源,如何將這些生物大數(shù)據(jù)資源轉化為具備理論指導意義的知識價值并探索序列進化和功能演變的本質與動力,是生命前沿交叉學科領域亟待解決的重大科學問題。甲基化修飾作為表觀遺傳學領域最重要的調控方式之一,在疾病發(fā)生和胚胎發(fā)育的細胞重編程中發(fā)揮著重要的作用。TET家族、ALKBH家族以及KDM家族均為依賴Fe2+和α-酮戊二酸的功能保守的甲基化酶,同時其催化的底物類型在整個中心法則(DNA-RNA-Protein)層面具有豐富的多樣性并且調控機制各異。因此,這三個蛋白質家族既是研究胚胎發(fā)育以及疾病發(fā)生的熱門對象,也是研究序列結構進化非常理想的模型蛋白。
“雙一流”學科建設以來,左永春教授依托生命科學學院、省部共建國家重點實驗室計算生物學平臺,在內蒙古大學大學生創(chuàng)新訓練項目的持續(xù)資助下,結合生命大數(shù)據(jù)前沿交叉學科《生物信息學》課程的實踐教學環(huán)節(jié),帶領我院的本科生和研究生科研創(chuàng)新小組,圍繞“依賴Fe2+和α酮戊二酸的去甲基化酶功能發(fā)揮的結構和序列基礎”,展開了關于DNA去甲基化酶TET(Ten-eleven translocation),RNA去甲基化酶ALKBH(AlkB homologs)以及組蛋白去甲基化酶KDM(Histone lysine demethylases)的一系列連續(xù)深入系統(tǒng)的科研工作。
課題組對KDM家族進行了深度的蛋白質結構生物信息學序列分析。盡管KDM家族與TET,ALKBH家族相比具有共同的催化核心,但是三者之間具有顯著的差異。KDM家族具有更為復雜多樣的序列模體,并且已經出現(xiàn)了非常明顯的motif角色分工,這導致KDMs的靶向定位以及活性調控更為精細,更為多樣,猶如精密的機器零件一般,呈現(xiàn)出模塊化的活性??偨Y出34個KDM序列模體,并將這些模體分為四類:催化模體,定位模體,調控模體和潛在模體。這樣的分類便于更好更清晰的理解家族成員眾多,功能多樣,調控機制極其復雜的KDM蛋白。在此基礎上,進一步剖析了由四類模體決定的多樣的生物功能。催化模體是KDM的核心,定位模體幫助催化模體去除特定的甲基化修飾的賴氨酸;調控模體參與酶-底物復合體的形成、互作網(wǎng)絡和轉錄調控的穩(wěn)定性;雖然潛在模體的功能尚不清楚,但其功能極可能與調控模體相似。最后,從序列模體的角度作出了KDM模塊化活性示意圖,進一步闡述KDM家族功能多樣性。該研究成果2020年9月29日發(fā)表在國際生物信息學權威學術期刊Briefings in Bioinformatics(2019 IF:8.990)上,第一作者為我校生命科學學院2016級生物工程專業(yè)本科生王澤蓉。
另外,小組成員們進一步開始研究具有與TET家族相同催化核心的ALKBH家族(RNA去甲基化酶)。與DNA去甲基化酶TET家族相比,ALKBH家族具有廣泛的底物選擇性包括DNA,RNA和蛋白質。研究人員發(fā)現(xiàn)九個ALKBH家族成員的催化結構域主要由四個關鍵loop組成,分別是L1、L2、L3、L4,詳細描述了四個關鍵loop及非同源結構域與ALKBH底物選擇性的關系。在此基礎上,我們總結出了ALKBH的五種底物類型。AlkB含有四個關鍵loop,可通過擠壓和翻轉堿基的方式來修復損傷的DNA。 ALKBH2將其三個loop插入dsDNA中以輔助催化。ALKBH3、ALKBH5和FTO中的關鍵loop形成較窄的催化裂口,并傾向于結合單鏈核酸。ALKBH1、ALKBH8和FTO都具有非同源結構域,以幫助其結合具有特殊構象的核酸,例如tRNA和snRNA等。該成果2020年8月初在線發(fā)表在國際著名學術期刊Cellular and Molecular Life Sciences(2018 IF: 7.014),第一作者為我校生命科學學院2016級生物工程專業(yè)本科生許寶芳。
除此之外,自2016年開始課題組就已經開始了對DNA去甲基化酶TET蛋白家族進行深度的序列和結構生物信息學分析工作,探索了三個TET家族成員間的進化關系的保守性和差異性。發(fā)現(xiàn)三個TET家族成員TET1、TET2和TET3的催化功能域具有高度同源性,但其靶向定位模體和功能調控模體卻具有顯著差異性。催化功能域的保守性體現(xiàn)在:TET1、TET2和TET3的催化活性均依賴于Fe2+和α-酮戊二酸,F(xiàn)e2+結合模體偏向組氨酸和天冬氨酸,α-酮戊二酸結合模體偏向組氨酸、絲氨酸和精氨酸。差異性集中表現(xiàn)在靶向定位和功能調控上,文章中新鑒定出的兩個未知元件可能與TET3潛在功能有關。這種因編碼序列而產生的差異性在可變剪接過程中,產生了多樣的轉錄變體和蛋白質亞型,經過翻譯后修飾,各自執(zhí)行其特有功能。相關研究成果已于2019年9月正式發(fā)表在國際生物信息學權威學術期刊Briefings in Bioinformatics(2018 IF: 9.101),第一作者為我校生命科學學院2014級生物科學基地本科生劉東陽,論文發(fā)表后,國際同行給予積極評價,根據(jù)最新Web of Science統(tǒng)計顯示,該論文2020年3/4月-至今被ESI 1%高被引論文收錄。
相關論文鏈接:
1.https://academic.oup.com/bib/article/20/5/1826/5045641?searchresult=1
2.https://link.springer.com/article/10.1007/s00018-020-03594-9
3.https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbaa215/5912575
版權與免責聲明:本網(wǎng)頁的內容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構成其他建議。僅提供交流平臺,不為其版權負責。如涉及侵權,請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com