近日,浙江大學(xué)農(nóng)業(yè)與生物技術(shù)學(xué)院沈星星研究員、陳學(xué)新教授以及美國范德堡大學(xué)Antonis Rokas教授課題組聯(lián)合在Nature Communications發(fā)文闡明:系統(tǒng)發(fā)育樹存在~9% -18%的不可重復(fù)性危機。
研究結(jié)果可重復(fù)或可再現(xiàn)性是科學(xué)界的基石。在過去的幾年里,科學(xué)家對已發(fā)表結(jié)果可重復(fù)性的擔(dān)憂不斷增加,導(dǎo)致了“再現(xiàn)性危機”一詞的出現(xiàn)。系統(tǒng)發(fā)育樹是進化生物學(xué)研究的基礎(chǔ)。例如,系統(tǒng)發(fā)育樹通常被用來研究基因、基因組、物種的演化過程。2013年報告稱:由于缺乏數(shù)據(jù)公開化,6277 / 7539(83.3%)研究課題的系統(tǒng)發(fā)育樹是不可重復(fù)的。這一研究促使了多個公共存儲數(shù)據(jù)庫的誕生(如figshare)。?
公共數(shù)據(jù)庫提供的信息是否足夠系統(tǒng)發(fā)育樹的重復(fù)構(gòu)建?此外,系統(tǒng)發(fā)育樹的構(gòu)建參數(shù)、計算資源(CPU處理器型號、線程數(shù)等)均存在差異。這些差異是否會導(dǎo)致不可重復(fù)的系統(tǒng)發(fā)育樹?什么原因?qū)е虏豢芍貜?fù)的系統(tǒng)發(fā)育樹? 如何規(guī)避不可重復(fù)危機?回答這一系列問題有利于提高系統(tǒng)發(fā)育樹的再現(xiàn)性,同時為系統(tǒng)發(fā)育學(xué)軟件開發(fā)者提供重要的指導(dǎo)依據(jù)。
本研究收集了15個動物、植物、真菌系統(tǒng)發(fā)育基因組學(xué)數(shù)據(jù)集(總共19414個基因比對數(shù)據(jù))。這15個數(shù)據(jù)集包含非編碼DNA (DNA)、外顯子(DNA)、氨基酸(AA)三類數(shù)據(jù)集?;蚱骄L度約620位點,平均包含180個物種?;?9414個基因數(shù)據(jù)集,我們檢驗了常用系統(tǒng)發(fā)育樹構(gòu)建軟件IQ-TREE和RAxML-NG可重復(fù)性。對每一個基因,運行兩次完全相同的參數(shù)(Run1和Run2),并比較Run1和Run2產(chǎn)生的系統(tǒng)發(fā)育樹是否一致(圖A)
研究結(jié)果表明:IQ-TREE和RAxML-NG分別存在81.9%和90.7%的系統(tǒng)發(fā)育樹可重復(fù)。比較IQ-TREE和RAxML-NG之間,僅20.3%系統(tǒng)發(fā)育樹可重復(fù)(圖B和C)。利用UCE、AHE等捕獲技術(shù)收集的數(shù)據(jù)存在更高比例的不可重復(fù)性??偨Y(jié):計算資源差異(如CPU數(shù)目差異、CPU型號差異)、不同初始隨機數(shù)以及系統(tǒng)發(fā)育信號低的基因等因素更易產(chǎn)生不可重復(fù)的系統(tǒng)發(fā)育樹。
?
?我們?nèi)绾翁岣呦到y(tǒng)發(fā)育樹的可重復(fù)性?考慮到系統(tǒng)發(fā)育基因組數(shù)據(jù)集中存在的成百上千個基因,一個更實用的方是公布每個分析的日志文件。因為日志文件包含所有關(guān)鍵參數(shù)(例如基因名、程序名、樹搜索的數(shù)量、替代模型、處理器類型、線程數(shù)量和隨機起始數(shù))。
浙江大學(xué)農(nóng)學(xué)院沈星星研究員為論文第一作者兼共同通訊作者,美國范德堡大學(xué)Antonis Rokas教授為共同通訊作者。陳學(xué)新教授對該研究給予了大力支持和悉心指導(dǎo)。另外,范德堡大學(xué)和威斯康星大學(xué)麥迪遜分校的李遠寧博士后、Chris Hittinger教授也參與了該研究。該研究受到中央高?;究蒲袠I(yè)務(wù)費專項、浙江大學(xué)“百人計劃”研究員啟動資金資助、國家自然科學(xué)基金國際聯(lián)合重點研究項目(No. 31920103005)和國家自然科學(xué)基金重點項目(No. 31702035)支持。
原文鏈接:https://www.nature.com/articles/s41467-020-20005-6
(昆蟲科學(xué)研究所供稿)
版權(quán)與免責(zé)聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構(gòu)成其他建議。僅提供交流平臺,不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com