首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进LDA主题模型的产品特征抽取
引用本文:佘维军,刘子平,杨卫芳.基于改进LDA主题模型的产品特征抽取[J].计算机与现代化,2016,0(11):1.
作者姓名:佘维军  刘子平  杨卫芳
基金项目:国家自然科学基金资助项目(90818028)
摘    要:针对LDA主题模型用于产品特征抽取中存在的问题,提出将句法分析和主题模型相结合的SA-LDA方法。首先基于句法分析对产品所在类别下的所有产品评论进行分析抽取显式特征,并聚类产生特征集和观点集,据此构建语料库。接着对待分析产品的每条评论,提取主观句并利用改进LDA模型对其主题进行学习,根据语料库构建must-link和cannot-link约束条件,在主题更新时对其进行约束和引导,每个主题对应一个特征类。实验表明,本文方法对显式特征和隐式特征都具有很好的实验效果,且相比传统的方法和其他改进方法在保证召回率的同时对准确率也有一定程度的提高。 

关 键 词:潜在狄利克雷分布  主题模型    句法分析    特征抽取    约束条件  
收稿时间:2016-11-23
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号