9月10日,《自然》旗下《通讯—生物》在线发布了华中农业大学教授赵书红团队创建的国际上首个猪整合组学知识库ISwine。该知识库创建了一个基于卷积神经网络模型和多组学信息的候选基因评分推荐系统,打通了从全基因组关联分析(GWAS)结果的显著标记到候选基因推荐的“最后一公里”。
论文通讯作者赵书红介绍,单一组学的分析,如全基因组关联分析,往往止步于标记和表型间的“相关”,难以揭示“因果”。而中心法则告诉人们,遗传信息从DNA转录到RNA,再翻译生成各种蛋白质,行使特定的生物功能,一个完整的生物过程需要多个组学的参与。
赵书红说,近年来,猪的多组学信息呈超指数型增长,如何解读海量异质性的多组学数据,整合来自不同研究的多组学信息以解析遗传变异与重要经济性状间的关系,面临着极大的挑战。
为解决上述问题,团队收集了公共数据库中近乎所有的猪基因组数据、转录组数据以及性状相关的文献组数据。通过清洗、分析和结构化等过程,将这些数据以基因组变异数据库、基因表达数据库以及QTX数据库的形式收录到ISwine中。
其中,基因表达数据库是猪中第一个基于转录组数据的表达谱数据库,基因变异数据库是猪中最大的变异信息数据库。美国国家生物技术信息中心(NCBI)在2018年停止了对猪dbSNP数据库的更新。而ISwine将为猪遗传育种研究人员提供丰富的基因组变异信息和完备的单倍型信息。
另外,ISwine根据不同组学特点提供了用户界面友好的浏览、检索、可视化、交互和下载模块,用户可以节约大量分析时间和费用,方便快捷的利用海量组学信息。例如,直接输入全基因组关联分析结果或候选基因列表,ISwine会针对目标性状推荐“高分”候选基因。该策略可拓展应用到其他物种,为多组学信息在遗传和育种中的应用提供了新思路。
上述研究工作得到了国家自然科学基金等项目的资助。
ISwine知识库:http://iswine.iomics.pro
ISwine使用示例:http://iswine.iomics.pro/pig-iqgs/commonView?viewName=Tutorial