2021年11月18日,國際權(quán)威期刊Nucleic Acids Research(中科院JCR期刊1區(qū),五年影響因子為15.542,)在線發(fā)表了農(nóng)學(xué)院李飛教授團(tuán)隊題為“InsectBase 2.0: a comprehensive gene resource for insects”的研究論文。該研究通過廣泛收集與分析昆蟲基因數(shù)據(jù),構(gòu)建起目前昆蟲學(xué)領(lǐng)域最為廣泛、全面、標(biāo)準(zhǔn)化的數(shù)據(jù)平臺,為昆蟲學(xué)各領(lǐng)域研究提供了寶貴資源。
?
昆蟲作為世界上多樣性最為豐富的物種,約占物種總數(shù)的85%以上。隨著高通量測序技術(shù)的迅速發(fā)展,產(chǎn)生了大量的昆蟲基因組數(shù)據(jù)。這些數(shù)據(jù)散亂分布在不同數(shù)據(jù)庫中,缺乏統(tǒng)一格式標(biāo)準(zhǔn)以及深度信息挖掘,極大阻礙了昆蟲學(xué)基因數(shù)據(jù)的充分利用與標(biāo)準(zhǔn)化分析。
本研究共搜集了昆蟲綱20個目中815種昆蟲的基因組、25805個轉(zhuǎn)錄組以及1674個小RNA文庫數(shù)據(jù)?;谶@些數(shù)據(jù),通過標(biāo)準(zhǔn)化流程注釋了482個昆蟲基因組,最終獲得了超過1500萬條蛋白編碼基因、11萬條miRNA以及129萬條lncRNA。除此之外,本研究通過進(jìn)一步分析,預(yù)測了miRNA靶標(biāo)基因、lncRNA partner基因,注釋了164個常見昆蟲基因家族、419個KEGG通路以及預(yù)測了21萬個潛在的水平轉(zhuǎn)移(HGT)基因,提供了更多數(shù)量、更高質(zhì)量以及更多層次的昆蟲基因數(shù)據(jù)。
通過匯總和整理以上數(shù)據(jù),構(gòu)建起InsectBase 2.0昆蟲綜合基因數(shù)據(jù)庫,共包含Organism,Chromosome,Genome,Transcriptome,Gene,Gene family,HGT gene,KEGG pathway,Insect virus,Tools,Links和Service共11個模塊。網(wǎng)站提供了物種信息查詢、不同類型基因、病毒數(shù)據(jù)的搜索與下載功能。除此之外,InsectBase 2.0集成了BLAST,JBrowse2工具,提供了七百余種物種的基因BLAST與基因組瀏覽器功能。同時基于MCScanX共線性分析,提供了155個染色體級別基因組之間的共線性可視化分析,為昆蟲染色體進(jìn)化提供了有力的工具。
本論文第一作者為浙江大學(xué)昆蟲所博士生梅洋,通訊作者為浙江大學(xué)李飛教授。浙江大學(xué)昆蟲所研究生荊冬、湯沈楊與陳曦等參與了本項目的研究。本研究得到了國家自然科學(xué)基因、國家高技術(shù)研究發(fā)展計劃、浙江省國家自然科學(xué)基金等項目資助。
數(shù)據(jù)庫網(wǎng)址:http://v2.insect-genome.com/??
文章鏈接:https://academic.oup.com/nar/advance-article-abstract/doi/10.1093/nar/gkab1090/6430839
版權(quán)與免責(zé)聲明:本網(wǎng)頁的內(nèi)容由收集互聯(lián)網(wǎng)上公開發(fā)布的信息整理獲得。目的在于傳遞信息及分享,并不意味著贊同其觀點或證實其真實性,也不構(gòu)成其他建議。僅提供交流平臺,不為其版權(quán)負(fù)責(zé)。如涉及侵權(quán),請聯(lián)系我們及時修改或刪除。郵箱:sales@allpeptide.com