近日,國際生物信息學重要期刊《Briefings in Bioinformatics》在線發(fā)表了上海交通大學生命科學技術學院魏冬青課題組的研究成果“DTI-MLCD: predicting drug-target interactions using multi-label learning with community detection method”。該論文提出的基于網絡的標簽空間劃分的多標簽多分類學習方法為藥物-靶標相互作用(drug-target interaction , DTI)預測問題提供了一種新的思路。該方法為下游新藥設計、老藥新用提供了理論和實踐依據,具有一定的理論意義和重要應用價值。上海交通大學生命科學技術學院“致遠榮譽計劃”博士生褚晏伊為第一作者,生命科學技術學院長聘教授魏冬青、副研究員熊毅為共同通訊作者,加拿大皇家學會院士、美國AAAS院士、加拿大卡爾加里大學教授Dennis Russell Salahub為論文合作者。
藥物發(fā)現是識別具有潛在治療作用的新候選化合物的過程,在此過程中,預測藥物-靶標相互作用研究是一個必不可少的步驟。蛋白質是重要的藥物靶標,藥物通過與各種靶標相互作用在人體中發(fā)揮重要作用,可以增強或抑制其功能,發(fā)揮調控作用以達到治療某一種疾病目的。因此,識別DTIs可以幫助理解藥物的作用機制,對新靶點的發(fā)現、藥物的重定位等有著至關重要的作用。此外,由于DTI的實驗確定既耗時又耗費資源,現有的方法和工具還有諸多缺陷和不足,因此非常需要開發(fā)高效的計算方法,以充分利用已知DTI的異質生物學數據來厘清藥物在人體中的作用機理。在過去的幾十年中,已經開發(fā)出許多用于預測DTI的計算方法,但是尚存在精度低、假陽性高等問題。
圖1. DTI預測方法簡要分類
在DTI預測問題上,魏冬青課題組于2019年12月曾在《Briefings in Bioinformatics》在線發(fā)表了“DTI-CDF: a cascade deep forest model towards the prediction of drug-target interactions based on hybrid features”(?https://doi.org/10.1093/bib/bbz152),發(fā)展了深度級聯森林的人工智能方法DTI-CDF(圖2),在小樣本量數據的情況下可獲得性能媲美或優(yōu)于深度學習的結果。隨后,進一步提出了多標簽分類框架DTI-MLCD(圖3),避免了冗余特征空間和高特征維度導致的過擬合等問題,并且可以一次預測藥物或靶標的一系列相互作用。此外,魏冬青課題組更新了2008年建立的金標準數據集,將數據量增加了3倍,并公開了數據集更新的代碼,以便于其他科研人員隨時更新,并使用最新代碼進行科學研究。最重要的是,根據該課題組研究建立的AI藥物篩選平臺,篩選出了新冠病毒的有效的中藥有效成分抑制劑和多肽——人腸防御素5 (HD5),獲得鐘南山院士團隊和合作單位陸軍軍醫(yī)大學王軍平團隊的實驗驗證(魏冬青為共同通訊作者的論文成果發(fā)表在消化病學頂級期刊《Gastroenterology》,https://doi.org/10.1053/j.gastro.2020.05.015)。
圖2.?DTI-CDF框架
圖3. DTI-MLCD框架
另外,在非編碼與疾病的相關性預測上,基于深度隨機森林算法和序貫學習的過程,在學習和過程中考慮標簽之間的相關性,魏冬青課題組也發(fā)展并構建了深度隨機森林在多標簽預測中的應用。在小樣本數據的情況下,獲得了與深度學習相媲美的結果。2020年6月,該成果在《Briefings in Bioinformatics》發(fā)表?“MLCDForest: multi-label classification with deep forest in disease prediction for long non-coding RNAs”( https://doi.org/10.1093/bib/bbaa104)。
此外,預測CYP450酶-底物選擇性(即一個候選藥物分子會被哪一種或哪幾種CYP450酶識別和結合)將能促進對藥物分子的藥代動力學毒理學性質、藥物相互作用等方面的理解,最終也將促進藥物發(fā)現和開發(fā),具有重要的臨床意義。2019年11月,美國化學學會出版的《Journal of Chemical Information and Modeling》期刊上還出版了魏冬青課題組題為“Prediction of CYP450 Enzyme-Substrate Selectivity Based on the Network-Based Label Space Division Method”(https://doi.org/10.1021/acs.jcim.9b00749)的論文,為CYP450酶-底物選擇性預測問題提供了一種新的解決思路。
該系列研究獲得了國家重點研發(fā)計劃(2016YFA0501703)、國家自然科學基金重點項目(61832019)、面上項目(61872094)、青年項目(31601074)等項目資助。
論文鏈接:https://doi.org/10.1093/bib/bbaa205
版權與免責聲明:本網頁的內容由收集互聯網上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構成其他建議。僅提供交流平臺,不為其版權負責。如涉及侵權,請聯系我們及時修改或刪除。郵箱:sales@allpeptide.com