首页 | 本学科首页   官方微博 | 高级检索  
     

一种大规模数据的快速潜在语义索引
引用本文:卫威,王建民.一种大规模数据的快速潜在语义索引[J].计算机工程,2009,35(15):35-37,4.
作者姓名:卫威  王建民
作者单位:1. 清华大学计算机科学与技术系,北京,100084
2. 清华大学软件学院,北京,100084
摘    要:潜在语义索引(LSI)已应用到现代信息检索的多个领域,但矩阵奇异值分解的高复杂度阻碍了该技术在大规模数据上的应用。提出一种大规模数据的快速LSI方法。给出一个降维问题的统一框架,LSI作为一种特征提取算法,可以在这个框架下转化为一个特征选择问题。利用该技术在最大程度保持LSI降维效果的同时,简化LSI的计算,使其能够应用于大规模数据。

关 键 词:潜在语义索引  降维  特征选择  特征提取
修稿时间: 

Fast Latent Semantic Indexing on Large-scale Dataset
WEI Wei,WANG Jian-min.Fast Latent Semantic Indexing on Large-scale Dataset[J].Computer Engineering,2009,35(15):35-37,4.
Authors:WEI Wei  WANG Jian-min
Affiliation:1.Department of Computer Science and Technology;Tsinghua University;Beijing 100084;2.School of Software;Beijing 100084
Abstract:Latent Semantic Indexing(LSI) has been successfully applied to various fields in modern information retrieval.However,the high computational complexity of Singular Value Decomposition(SVD) makes it improbable on the application of large-scale dataset.This paper proposes a fast LSI approach to solve this problem.It gives a unified framework of dimension reduction problem.As a feature extraction method,LSI can be transformed into a feature selection method within this framework.This new strategy can simplify ...
Keywords:Latent Semantic Indexing(LSI)  dimension reduction  feature selection  feature extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号