1 论文标题:基于无监督特征选择的半导体质量检测方法
2 作者信息:余青青:重庆工商大学数学与统计学院,重庆
3 出处和链接:余青青. 基于无监督特征选择的半导体质量检测方法[J]. 统计学与应用, 2026, 15(2): 31-48.
https://doi.org/10.12677/sa.2026.1520324 摘要:半导体质量检测数据存在高维冗余、类别不平衡及标签获取成本高的特性,导致传统有监督检测方法工业适用性受限,而传统无监督特征选择方法往往忽略全局结构或缺乏冗余量化机制,难以适配高维强非线性耦合的数据需求。基于此,本文提出一种面向半导体高维制造数据的无监督特征选择方法FSSC-DCOR (Feature Selection by Spectral Clustering and Distance CORrelation coefficient)。该方法结合谱聚类、距离相关系数与贪心策略三种技术,以特征为聚类对象,通过谱聚类挖掘特征内在关联结构并筛选高信息量候选特征,利用距离相关系数矩阵量化非线性冗余,最终通过贪心策略保留低冗余、高区分度的核心特征子集。该方法无需依赖标注标签即可完成高维数据有效降维,适配半导体场景标签稀缺的现实需求。实验结果表明,在半导体数据集上,所提方法的性能度量指标均优于传统特征选择方法。