南湖新闻网讯(通讯员 李伟夫)近日,我校理学院陈洪教授人工智能与统计学习团队研究成果以“Huber Additive Models for Non-stationary Time Series”为题在International Conference on Learning Representations(ICLR 2022)发表。该研究从理论上刻画了传统方法对于非平稳时间序列数据的不足,并基于理论结果有针对性的设计处理非平稳时间序列的预测算法。该算法不仅能实现非平稳时间序列的预测,而且能有效的克服数据中异常值的扰动,为农业、金融与医学等领域的非平稳数据处理提供了有效的策略与工具。
稀疏可加模型在处理时间序列数据时表现出良好的灵活性和可解释性。然后,现有的方法通常假设时间序列数据是平稳的,且服从高斯分布。对于金融和医疗领域等经常出现的重尾非平稳时间序列数据,这两种假设都过于严格。
为了解决该问题,研究提出了一种自适应稀Huber可加模型 (SpHAM) ,以实现面向非高斯数据和(非)平稳数据的稳健预测。理论上,对于平稳和非平稳时间序列数据,研究建立了独立于观测混合条件的泛化误差界。特别地,非平稳时间序列情形的误差界包含数据分布随时间变化的差异度量,借助该差异度量的经验估计可用于改造正则模型的惩罚项。应用上,该方法在合成和真实基准数据集上显示了良好的性能。
传统稀疏可加模型与论文所示方法的差异
SpHAM在不同噪声、不同种类(平稳、非平稳)时间序列数据下的有效性
该研究是陈洪教授前期可加模型系列CCF A人工智能顶会工作和人工智能顶刊工作的进一步延续和深入,得到了国家自然科学基金面上项目等的资助。该论文合作单位包括京东探索研究院、悉尼大学等。理学院博士研究生王英杰为论文第一作者,陈洪教授为论文通讯作者。
审核人:石峰