
近日,由西南财经大学数据科学与商业智能联合实验室博士生沈宗鑫、黄雁勇教授、堪萨斯大学王东杰助理教授、清华大学博士后马敏博、西南交通大学吕凤毛副教授、李天瑞教授合作完成的论文"Causally-Aware Unsupervised Feature Selection Learning"被图像处理领域的国际顶级学术期刊《IEEE Transactions on Image Processing》(CCF A类期刊)正式接收。
内容简介
近年来,无监督特征选择因其在处理无标签高维数据方面的有效性受到了广泛关注。然而,现有方法通常忽略了数据中潜在的因果机制,导致选取了大量与下游任务无关的特征,并削弱了特征选择过程的可解释性。此外,当前基于图的方法在构建相似度图时未能充分区分因果特征与非因果特征的重要性,导致生成的图中存在许多虚假的连接。为解决上述问题,本文提出了一种基于因果感知的无监督特征选择方法。该方法引入了新的因果正则项并将其整合到广义的无监督谱回归模型中,通过对样本进行重加权来平衡各特征的混杂分布,有效地减少了特征与聚类标签之间的虚假关联,实现了因果驱动的特征选择。进一步,本文方法采用因果引导的层次聚类,将具有不同因果贡献的特征分组,并在每组内自适应地学习相似性图。在多图融合过程中通过增强因果特征的权重、抑制非因果特征的影响,从而更准确地刻画数据的局部几何结构,显著提升特征选择性能。大量实验结果表明,本文方法在性能上明显优于现有先进方法,其可解释性也在实际数据中得到了进一步验证。
作者简介
沈宗鑫,西南财经大学2022级经济大数据分析专业博士生,导师为常晋源教授和黄雁勇教授,主要从事数据挖掘和模式识别等领域的研究。
黄雁勇,西南财经大学数据科学与商业智能联合实验室教授、博士生导师,主要从事Data-centric AI,多模态学习,增量学习等领域的研究。
王东杰,堪萨斯大学电气工程与计算机科学系助理教授,主要从事数据中心的人工智能、因果图学习、时空数据挖掘等领域的研究。
马敏博,清华大学博士后,主要从事人工智能与时空数据挖掘技术在可再生能源、城市计算等领域的交叉应用研究。
吕凤毛,西南交通大学计算机与人工智能学院副教授,博士生导师,主要从事多模态学习、开放世界学习、多媒体内容分析、人工智能安全等领域的研究。
李天瑞,西南交通大学计算机与人工智能学院院长,教授,博士生导师,四川省工业软件技术研究院院长,四川省学术与技术带头人,人工智能研究院副院长,综合交通大数据应用技术国家工程实验室副主任,系统可信性自动验证国家地方联合工程实验室副主任,可持续城市交通智能化教育部工程研究中心常务副主任,四川省云计算与智能技术高校重点实验室主任,中国人工智能学会理事,中国计算机学会成都分部主席,四川省人工智能学会副理事长,主要从事人工智能、数据挖掘与知识发现、云计算与大数据以及粒计算与粗糙集等领域的研究。
电话:86-028-87352207
地址:四川省成都市青羊区光华村街55号
邮编:610074
西南财经大学 数据科学与商业智能联合实验室 版权所有
蜀ICP备05006386号