
近日,由堪萨斯大学王东杰教授、西南财经大学数据科学与商业智能联合实验室黄雁勇教授、波特兰州立大学刘鲲鹏博士、中科院计算机网络信息中心肖濛研究员、王鹏飞研究员、澳门大学汪澎洋博士、香港科技大学熊辉教授、亚利桑那州立大学傅衍杰教授等合作完成的论文“Towards data-centric ai: A comprehensive survey of traditional, reinforcement, and generative approaches for tabular data transformation”被数据挖掘领域权威期刊ACM Transactions on Knowledge Discovery from Data正式接收。
内容简介
以数据为中心的人工智能通过提高数据质量与数据表征能力,已成为推动模型性能提升的关键途径之一。表格数据作为各行业最广泛使用的数据形式之一,支撑着金融、医疗保健、市场营销等领域的关键应用。本文系统综述了以表格数据为中心的人工智能研究进展,重点围绕特征选择与特征生成两类优化数据空间的关键技术展开分析。在特征选择方面,总结了过滤式、包裹式、嵌入式、混合式以及多视图特征选择等传统技术路径;在特征生成方面,梳理了基于人工经验的数学变换、统计表示和领域知识构造方法,以及自动化特征交互、非线性变换和迭代优化等主要方法。在此基础上,本文进一步综述了强化学习和生成式人工智能在自动化特征工程中的新进展,比较分析了传统方法与先进方法在性能、可解释性、自动化程度、适应性和鲁棒性等方面的特点,并对自动化特征工程、可解释人工智能、隐私保护、联邦学习、多模态融合以及大语言模型在表格数据处理中的应用前景进行了展望,为相关领域研究与实践提供了系统参考。
电话:86-028-87352207
地址:四川省成都市青羊区光华村街55号
邮编:610074
西南财经大学 数据科学与商业智能联合实验室 版权所有
蜀ICP备05006386号