首页 | 本学科首页   官方微博 | 高级检索  
     

基于短文本的独立语义特征抽取算法
引用本文:胡佳妮,郭 军,邓伟洪,徐蔚然.基于短文本的独立语义特征抽取算法[J].通信学报,2007,28(12):121-124.
作者姓名:胡佳妮  郭 军  邓伟洪  徐蔚然
作者单位:北京邮电大学,信息工程学院,北京,100876
摘    要:提出了一种基于短文本的独立语义特征抽取算法,旨在降低文本向量的稀疏性并提其高语义表示能力。该算法首先采用潜在语义分析降低文本的维数并去除噪声,然后运用独立成份分析方法在潜在语义特征中提取出最能表达语义且相互统计独立的特征。实验表明此算法优于潜在语义索引算法。

关 键 词:特征  语义  独立成份
文章编号:1000-436X(2007)12-0121-04
收稿时间:2007-09-01
修稿时间:2007-11-18

Independent semantic feature extraction algorithm based on short text
HU Jia-ni,GUO Jun,DENG Wei-hong,XU Wei-ran.Independent semantic feature extraction algorithm based on short text[J].Journal on Communications,2007,28(12):121-124.
Authors:HU Jia-ni  GUO Jun  DENG Wei-hong  XU Wei-ran
Abstract:An independent semantic feature extraction algorithm was proposed, aiming at reducing the sparseness of short text and enhancing its capability of semantic expression. The algorithm first makes use of latent semantic indexing to reduce the dimension and wipe off noise, and then it introduces independent component analysis to extract statistic independent and semantic features. Experimental results prove the feasibility of the algorithm and demonstrate it is superior to latent semantic indexing.
Keywords:feature  semantic  independent component
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《通信学报》浏览原始摘要信息
点击此处可从《通信学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号