首页 | 本学科首页   官方微博 | 高级检索  
     

基于关联词的主题模型语义标注
引用本文:周亦鹏,杜军平.基于关联词的主题模型语义标注[J].智能系统学报,2012(4):327-332.
作者姓名:周亦鹏  杜军平
作者单位:北京工商大学计算机与信息工程学院;北京邮电大学智能通信软件与多媒体北京市重点实验室
基金项目:国家“973”计划资助项目(2012CB821206);国家自然科学基金资助项目(91024001,61070142);北京市自然科学基金资助项目(4111002)
摘    要:互联网主题分析中经常采用概率主题模型对主题进行描述,但存在对于一般用户难以理解的问题,提出一种概率主题模型的自动语义标注方法.首先通过基于语义分类的关联规则挖掘关联主题词并建立候选标签集合,然后以关联词在数据集中的概率分布来设计相关性判别函数,计算候选标签和主题模型的相关度,最后根据最大边缘相关选择高语义覆盖度和区分度的标签.在食品安全和旅游领域主题模型标注的实验表明,与最大概率主题词标记方法相比,提出的方法能够明显提高标注的准确性,并且解决了多标签标记中语义类别单一的问题,能够以较少数量的标签表达更为丰富的语义,这有助于进一步实现更为准确的主题跟踪和主题信息检索.

关 键 词:主题分析  语义标注  生成模型  关联词  关联规则

Semantic tagging of a topic model based on associated words
ZHOU Yipeng,DU Junping.Semantic tagging of a topic model based on associated words[J].CAAL Transactions on Intelligent Systems,2012(4):327-332.
Authors:ZHOU Yipeng  DU Junping
Affiliation:1.School of Computer Science and Information Engineering,Beijing Technology and Business University,Beijing 100048,China;2.Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia,Beijing University of Posts and Telecommunications,Beijing 100876,China)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号