南湖新闻网讯(通讯员 章文)近日,我校人工智能与知识发现团队提出了一种适用于多种分子网络关联预测任务的、可迁移的对比自监督深度图神经网络模型:CSGNN。此项工作是图神经网络在分子网络关联预测应用的最新成果。
大数据时代存在不同类型的分子网络,例如药物-靶点互作网络,药物-疾病关联网络、蛋白质-蛋白质互作网络等,从分子网络中找到尚未被发现的分子关联具有重要的研究价值。现有的计算方法大多只能专注解决某一类网络的关联预测问题,而且高度依赖网络实体的特征,方法不具有扩展性。此外,由于分子网络自身的稀疏性和关联分布的不均衡性,也存在训练样本不足、模型拟合效果差等问题。
该研究团队构建了一个图神经网络增强框架,该框架包含两个重要部分:多步邻居深度图神经网络和对比学习图神经网络。前者通过同时聚合节点的多步邻居来更好的建模网络实体间的复杂关系,直接增强模型的表示能力;后者通过引入对比自监督学习机制,通过最大化局部与网络总体的互信息,使得模型可以自发产生“伪标签”数据,从而解决了训练样本缺少的问题,该方法对各种预测任务具有更好地适应性。CSGNN模型基于以上两个部分进行联合训练,具有良好的收敛性。综合实验表明,模型在7个有代表性生物医学数据集上成效显著,相比于之前的研究方法,其性能有了明显提升。
相关研究成果以“CSGNN: Contrastive Self-Supervised Graph Neural Network for Molecular Interaction Prediction”为题被第三十届国际人工智能联合会议(IJCAI)接收。IJCAI于1969年创办,是人工智能领域最主要、最具影响力的会议之一。信息学院章文教授为论文通讯作者,信息学院数据科学与大数据技术系本科生赵成帅为第一作者,信息学院教师刘世超,博士生黄锋,硕士生刘帅等参与了该研究工作。
审核:刘进