近日,華中農業(yè)大學信息學院楊慶勇教授課題組在國際學術期刊Molecular Plant上發(fā)表題為“BnIR: a multi-omics database with various tools for Brassica napus research and breeding”的研究成果。該研究搜集并整合了甘藍型油菜基因組、轉錄組、變異組、表觀遺傳、表型組和代謝組等6種組學數據,并構建出首個綜合性的油菜多組學數據庫—BnIR,為油菜遺傳育種研究提供了重要的數據資源和分析平臺。
油菜作為世界上最重要的油料作物之一,是人類食用植物油和飼用蛋白的主要來源。近年來,越來越多的高通量組學技術被應用于油菜研究,油菜多組學數據大量積累。首先,油菜多組學數據規(guī)模的激增,對數據存儲、檢索和分析提出了更高的需求。其次,不同來源、不同組學、不同平臺產生的生物大數據具有顯著的異質性,目前尚缺乏相對高效的整合和挖掘方法。因此,油菜領域迫切需要一個類似TAIR的、能夠支撐和服務油菜生物學研究的綜合性數據庫。
為解決這些問題,研究者利用生物信息團隊在數據整合和深度分析的經驗和優(yōu)勢,以前期發(fā)布的BnPIR、BnTIR以及BnVIR數據庫為基礎,進一步搜集了近年來新發(fā)布的多組學數據集,并進行了統(tǒng)一過濾、處理和分析,最終構建出目前最為系統(tǒng)和全面的油菜多組學數據庫-BnIR。在該研究中,研究者共搜集了29個甘藍型油菜以及近緣物種的基因組、2791個油菜組織樣本的轉錄組、2311個樣本的群體遺傳變異數據、118個表型、266個代謝物含量以及多種表觀基因組學數據(包括DNA甲基化、組蛋白修飾、染色質可及性和染色質交互強度等)組成的公共多組學數據。在BnIR數據庫中,研究者不僅整合并升級了BnPIR、BnTIR和BnVIR數據庫中的功能,而且基于不同組學數據的特征開發(fā)出多個新功能,以方便用戶更加有針對性地進行查詢和瀏覽。此外,基于群體多組學數據,研究者利用全基因組關聯分析、表達數量性狀位點定位、孟德爾隨機化和共定位分析等多種分析策略,對不同組學數據進行了關聯與整合。相關數據及結果已上傳至數據庫的多組學模塊,以方便用戶進行快速檢索、分析和利用。此外,BnIR數據庫還集成了18種在線分析工具,包括序列比對(BLAST、MSA)、富集分析(GO、KEGG)、關聯分析(GWAS、TWAS、eQTL等)、共定位分析(COLOC)、孟德爾隨機化分析(SMR)、遺傳相似性分析、ePCR、引物設計等。最后研究者以種子硫苷含量和含油量為例,系統(tǒng)地闡述了BnIR在解析遺傳變異位點對基因表達和表型影響方面的應用,展現了BnIR的在挖掘重要變異、探索變異作用機制方面的價值和潛力。
與其他現有的數據庫相比,BnIR是首個綜合性的油菜多組學數據庫,其不僅容納了迄今為止最豐富的多種組學數據,還整合和開發(fā)了多個組學數據搜索和分析工具,可以幫助研究者快速獲取并分析相關信息,為油菜研究者提供了“一站式”的數據檢索、獲取和挖掘服務。
華中農業(yè)大學信息學院楊慶勇教授為論文通訊作者,信息學院已畢業(yè)博士生楊植全(現廣州大學博士后),碩士生王升博為論文并列第一作者。我校油菜團隊周永明教授、郭亮教授對本項研究提供了指導。該項研究得到國家自然科學基金(32070559)、國家重點研發(fā)計劃(2021YFF1000100)、中國博士后基金(2022M710875)和海南省崖州灣種子實驗室生物信息學開發(fā)平臺(JBGS-B21HJ0001)、湖北省洪山實驗室(2021HSZD004)等項目的資助。
BnIR數據庫鏈接:http://yanglab.hzau.edu.cn/BnIR
BnIR使用示例: http://yanglab.hzau.edu.cn/BnIR/tutorial
原文鏈接:https://doi.org/10.1016/j.molp.2023.03.007
2023年3月21日
來源:華中農業(yè)大學南湖新聞網