train_features 是训练集的原始特征,test_features 是测试集的原始特征。我现在想先把训练集中每列进行标准化,然后用它的参数(平均值和标准差)去标准化测试集对应的列,问一下该怎么做?
1
acone2003 OP 我这样做对吗?
scaler = preprocessing.StandardScaler() Ens_seg1_all_std_probaes = scaler.fit_transform( Ens_seg1_all_probaes ) Ens_seg2_all_std_probaes = scaler.transform( Ens_seg2_all_probaes ) 其中 Ens_seg1_all_probaes 为训练集特征矩阵,Ens_seg2_all_probaes 为测试集的 |
2
capo Jul 11, 2018
没有思考过这个问题,一直都是先在整个数据集上做标准化这样的工作,然后再划分训练集之类的
|
3
glasslion Jul 11, 2018
对的
|
4
Morriaty Jul 11, 2018
训练集和测试集特征空间不一致,这模型还有什么用.....
|