首页 | 本学科首页   官方微博 | 高级检索  
     

参数嵌入算法在文本分类可视化中的应用
引用本文:张莹,王耀南,万琴.参数嵌入算法在文本分类可视化中的应用[J].计算机工程与应用,2009,45(16):31-35.
作者姓名:张莹  王耀南  万琴
作者单位:湖南大学,电气与信息工程学院,长沙,410082
基金项目:国家自然科学基金,国家高技术研究发展计划(863计划) 
摘    要:如何对文本分类的结果进行可视化研究一直是模式识别中研究的重点。在假设文本类别在低维嵌入空间服从高斯分布的前提下,通过朴素贝叶斯分类算法得到数据类别属性的后验概率矩阵,然后运用参数嵌入算法在低维空间可视化文本分类结果。参数嵌入算法是使嵌入空间数据的类后验概率与高维空间的条件概率Kullback Leibler散度和最小化的算法,属于同一类的数据在低维空间中分布较为集中,性质相似的数据之间的距离较近,而不同性质的数据之间距离则较大。其优点在于计算复杂度是数据的类别和相应个数的乘积,非常适合于数据量大,类别数较少的数据分类可视化。20新闻组数据集和微型新闻组数据集的实验结果证明了该算法的有效性。

关 键 词:朴素贝叶斯分类  参数嵌入  文本分类  后验概率  分类可视化
收稿时间:2009-2-10
修稿时间:2009-3-20  

Application of parametric embedding algorithm to text classifier visualization
ZHANG Ying,WANG Yao-nan,WAN Qin.Application of parametric embedding algorithm to text classifier visualization[J].Computer Engineering and Applications,2009,45(16):31-35.
Authors:ZHANG Ying  WANG Yao-nan  WAN Qin
Affiliation:ZHANG Ying,WANG Yao-nan,WAN Qin College of Electrical , Information Engineering,Hunan University,Changsha 410082,China
Abstract:How to visualize the text classifier result is one of the focus field in pattern recognition.On the assumption that each class can be represented by a Gaussian distribution in the embedding space,through Naive Bayes classification algorithms posterior probability for data over classes was got,Parametric Embedding(PE) algorithm was applied into the visualization of classification result in low-dimensional.PE algorithm tries to preserve the structure in an embedding space by minimizing a sum of Kullback-Leibl...
Keywords:Naive Bayes classifier  parametric embedding  text classification  posterior probability  classification visualization
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号