首页 | 本学科首页   官方微博 | 高级检索  
     

维吾尔语评论文本主题抽取研究
引用本文:禹龙,田生伟,黄俊. 维吾尔语评论文本主题抽取研究[J]. 中文信息学报, 2013, 27(4): 103-113
作者姓名:禹龙  田生伟  黄俊
作者单位:1. 新疆大学 网络中心, 新疆 乌鲁木齐 830046; 2. 新疆大学 软件学院, 新疆 乌鲁木齐, 830008;
3. 新疆大学 信息科学与工程学院, 新疆 乌鲁木齐 830046
基金项目:国家自然科学基金资助项目,国家社科基金资助项目
摘    要:主题抽取是意见挖掘的核心任务之一。该文面向维吾尔语评论文本, 针对显式主题和隐式主题, 提出了一种陈述级的主题抽取方法。该方法采用GLR-Cascaded LDA模型抽取段落级的局部主题、篇章级的全局主题, 建立全局—局部主题关系, 并将这些关系对应到每个意见陈述中; 然后运用Bootstrapping和模式匹配的方法进行显式陈述的主题抽取; 最后使用隐式主题推断算法推断隐式陈述的主题。主题抽取的最终目标是为每个意见陈述建立意见陈述—主题四元组。实验结果证明了该方法在主题抽取任务中的有效性。

关 键 词:主题抽取   陈述级   显式主题   隐式主题   维吾尔语  

Research on Topic Extraction from Uighur Comment Text
YU Long , TIAN Shengwei , HUANG Jun. Research on Topic Extraction from Uighur Comment Text[J]. Journal of Chinese Information Processing, 2013, 27(4): 103-113
Authors:YU Long    TIAN Shengwei    HUANG Jun
Affiliation:1. Net Center, Xinjiang University, Urumqi, Xinjiang 830046, China;
2. School of Software, Xinjiang University, Urumqi, Xinjiang 830008, China;
3. Information Science and Engineering Technology Institute, Xinjiang University, Urumqi, Xinjiang 830046, China
Abstract:Topic extraction is one of the core tasks of opinion mining. This paper proposes a claim-level topic extraction method, which aims at extracting explicit topics and implicit topics of Uighur comment texts. This method uses GLR-Cascaded LDA (Cascaded LDA model for global topic, local topic and the relation between them, GLR-Cascaded LDA) to extract the local topics of paragraph level, global topics of document level, establish the global-local topic relationship, and corresponds the relationships to each opinion claim. It adopts Bootstrapping and pattern matching to extract the topics of explicit claims. Finally, the implicit topic inference algorithm is applied to deduce the topics of implicit claims. The ultimate goal of topic extraction is to establish an opinion quadruple of claim-topic for each opinion claim. Experimental results indicate the effectiveness of the proposed method in topic extraction task.
Key wordstopic extraction; claim level; explicit topic; implicit topic; Uighur
Keywords:topic extraction  claim level  explicit topic  implicit topic  Uighur
本文献已被 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号