较大规模数据应用PCA降维的一种方法 |
| |
作者姓名: | 赵桂儒 |
| |
作者单位: | 中国地震台网中心; |
| |
基金项目: | 国家留学基金资助项目(201204190040) |
| |
摘 要: | PCA是一种常用的线性降维方法,但在实际应用中,当数据规模比较大时无法将样本数据全部读入内存进行分析计算。文章提出了一种针对较大规模数据应用PCA进行降维的方法,该方法在不借助Hadoop云计算平台的条件下解决了较大规模数据不能直接降维的问题,实际证明该方法具有很好的应用效果。
|
关 键 词: | 主成分分析 降维 大数据 |
本文献已被 CNKI 等数据库收录! |
|