我看李航的《统计学习方法》第二版,将 PCA 归入无监督学习的范畴。请教一下,PCA 的“学习结果”是什么?
比如线性回归学习结果是,你输入一个房子的位置,面积,房龄,房间数等信息,他能算出房屋参考售价。这是模型通过“学习”掌握的技能。他的学习成果是那个线性方程的一组系数
那么 pca 通过学习,掌握了什么技能呢?我感觉他只是把数据降维了。没学会什么技能啊。他的学习成果并不是任何函数。他给出了以最大方差为前提的新空间的基底,以及原数据在新空间的坐标。
从另一个角度对比:
回归模型,只要在房价不出现大的波动的前提下,训练好的模型在你给出一个新数据的(房子的位置,面积,房龄,房间数等信息)的参考报价。这个报价还是根据原来的线性方程组算出来的。
PCA 呢,你给一个 mxn 图片降维后,得到一组新空间的基底。你再给一个 mxn 的新图片降维,又会生成一组新空间的基底。假设我们都保留 95%的方差,这两组基底的数量可能不同吧?两组基底的第一主成分向量方向也可能不同吧?第一主成分保留的方差百分比也不同吧?所以好像也没有什么比较固定的训练成果保留下来啊。
比如线性回归学习结果是,你输入一个房子的位置,面积,房龄,房间数等信息,他能算出房屋参考售价。这是模型通过“学习”掌握的技能。他的学习成果是那个线性方程的一组系数
那么 pca 通过学习,掌握了什么技能呢?我感觉他只是把数据降维了。没学会什么技能啊。他的学习成果并不是任何函数。他给出了以最大方差为前提的新空间的基底,以及原数据在新空间的坐标。
从另一个角度对比:
回归模型,只要在房价不出现大的波动的前提下,训练好的模型在你给出一个新数据的(房子的位置,面积,房龄,房间数等信息)的参考报价。这个报价还是根据原来的线性方程组算出来的。
PCA 呢,你给一个 mxn 图片降维后,得到一组新空间的基底。你再给一个 mxn 的新图片降维,又会生成一组新空间的基底。假设我们都保留 95%的方差,这两组基底的数量可能不同吧?两组基底的第一主成分向量方向也可能不同吧?第一主成分保留的方差百分比也不同吧?所以好像也没有什么比较固定的训练成果保留下来啊。