我校机器学习团队在高维数据模式分类研究领域取得新进展_科学研究_新闻

核心提示：近日，我校信息学院王玉龙教授和理学院陈洪教授机器学习团队在IEEE Transactions on Cybernetics在线发表了题为“Generalized and Discriminative Collaborative Representation for Multiclass Classification”的研究论文。研究人员利用高维数据的内在本质低维结构信息提出了具有高可解释性、强判别性、高效率的高维数据模式分类方法。

南湖新闻网讯（通讯员李伟夫）近日，我校信息学院王玉龙教授和理学院陈洪教授机器学习团队在IEEE Transactions on Cybernetics在线发表了题为“Generalized and Discriminative Collaborative Representation for Multiclass Classification”的研究论文。研究人员利用高维数据的内在本质低维结构信息提出了具有高可解释性、强判别性、高效率的高维数据模式分类方法。

高维数据广泛存在于科学研究和社会生活的各个领域中，如高维生物基因表达数据、高维医学图像数据、互联网中的高分辨率图像（视频）数据。然而，高维数据往往会引起“维数灾难”，降低算法性能，并带来巨大的存储和计算负担。如何利用高维数据的内在结构信息克服上述困难，进而建立高效的高维数据学习方法及理论已成为机器学习领域的热点课题，具有重要的理论和应用价值。

本研究通过挖掘和利用高维数据的内在本质多低维子空间结构，设计了基于广义协同表示（Generalized Collaborative Representation）的高维数据模式分类一般框架，从更高层次分析不同表示分类方法的共同属性和差异，并给出了相应的理论分析，阐明了其分类原理和内在机制。为了进一步提升表示系数的辨识度和算法的分类性能，基于该框架设计了一种判别表示高维数据分类方法（Discriminative Representation based Classification, DRC）。该方法同时具备可解释性高、判别性强和效率高等优点。其分类与识别流程如下图。

此外，研究人员揭示了高维数据空间分布情况与DRC算法分类性能的关系，并建立了相应的理论保证。该项成果有助于深入理解高维数据的内在结构与模式识别的关系，为高维数据学习和其他机器学习任务的研究提供指导。

本研究是继2019年在IEEE Transactions on Pattern Analysis and Machine Intelligence和2020年在IEEE Transactions on Cybernetics发表原子表示高维数据学习相关成果后，该团队在高维数据人工智能方法研究领域取得的新进展。信息学院王玉龙教授为论文第一作者，理学院陈洪教授为论文通讯作者。该研究得到了国家自然科学基金面上项目和青年项目的资助。

审核人：石峰

论文链接：https://ieeexplore.ieee.org/document/9210834v