1 论文标题:基于多准则决策的不平衡感知数据集成特征选择算法
2 作者信息:王 刚, 任丽萍, 方 力:南京航空航天大学自动化学院,江苏 南京;徐维磊:南通思振电子科技有限公司,江苏 南通
3 出处和链接:王刚, 任丽萍, 方力, 徐维磊. 基于多准则决策的不平衡感知数据集成特征选择算法[J]. 传感器技术与应用, 2023, 11(6): 538-549.
https://doi.org/10.12677/JSTA.2023.1160614 摘要:在数据挖掘领域,不平衡数据普遍存在。在许多情况下,这些数据通常具有高维性和类不平衡性。不平衡数据集特征属性分布失衡,会造成分类性能下降,数据的高维性则会导致学习算法非常耗时。针对这一问题,提出了一种基于组合采样和集成学习的特征选择方法。首先使用组合采样方法,处理类不平衡问题,重点合成少数类样本,在保证数据集达到平衡的前提下去除噪声样本,将集成特征选择建模为一个多准则决策过程,使用VIKOR方法得到特征重要性排序,然后在序列前向搜索特征的过程中,使用XGBoost算法的准确率作为评估特征子集优劣的指标,确定最优特征子集。选择AUC、G-mean和F-measure作为评价指标,通过在5组不平衡数据集进行实验,证实了所提算法具有更好的分类效果,且模型的鲁棒性更好。