详解:如何用Python实现机器学习算法(5)
2017-12-25 MedSci MedSci原创
六、PCA主成分分析(降维) 全部代码 1、用处 数据压缩(Data Compression),使程序运行更快 可视化数据,例如3D-->2D等 ...... 2、2D-->1D,nD-->kD 如下图所示,所有数据点可以投影到一条直线,是投影距离的平方和(投影误差)最小 注意数据需要归一
详解:如何用Python实现机器学习算法(4) 六、PCA主成分分析(降维) 全部代码 1、用处 数据压缩(Data Compression),使程序运行更快 可视化数据,例如3D-->2D等 ...... 2、2D-->1D,nD-->kD 如下图所示,所有数据点可以投影到一条直线,是投影距离的平方和(投影误差)最小 注意数据需要归一化处理 思路是找1个向量u,所有数据投影到上面使投影距离最小 那么nD-->kD就是找k个向量, 所有数据投影到上面使投影误差最小 eg:3D-->2D,2个向量 就代表一个平面了,所有点投影到这个平面的投影误差最小即可 3、主成分分析PCA与线性回归的区别 线性回归是找x与y的关系,然后用于预测y PCA是找一个投影面,最小化data到这个投影面的投影误差 4、PCA降维过程 数据预处理(均值归一化) 公式: 就是减去对应feature的均值,然后除以对应特征的标准差(也可以是最大值-最小值) 实现代码: # 归一化数据 def featureNormalize(X):
作者:MedSci
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#机器#
0
好好学习.天天向上
102