这个话题的背景是,有一个因变量和大量的自变量,现在想对自变量降维,有很多方法,如PCA等等,还有就是在建立模型前对自变量处理,如去除那些方差为0的和方差很小的自变量等,然后用少量的与因变量有关系的自变量建模。
问题出在这了,
最近看文献说, Independent variables whose correlation with the response variable was not significant at 5% level were removed,
这句话 1、如何使用数学表达式来表示呢?
2、如何体现出自变量和因变量的显著性,用什么指标呢?
3、Y X1 X2 X3 .....Xn,是不是分别求出 X1.....Xn 与Y的表示显著相关的值(significant correlation),用哪个值表示呢?大于或者小于多少是显著相关呢?
谢谢,希望大家帮忙!