首页 | 本学科首页   官方微博 | 高级检索  
     

同主题词短文本分类算法中BTM的应用与改进
引用本文:刘泽锦,王洁.同主题词短文本分类算法中BTM的应用与改进[J].计算机系统应用,2017,26(11):213-219.
作者姓名:刘泽锦  王洁
作者单位:北京工业大学 信息学部 多媒体与智能软件技术北京市重点实验室, 北京 100124,北京工业大学 信息学部 多媒体与智能软件技术北京市重点实验室, 北京 100124
摘    要:为解决大规模短文本语料库主题模型参数K较大导致求解慢的问题,本文提出FBTM模型,将BTM中单个词对采样复杂度由O (K)降低O (1).针对短文本词语稀疏、描述能力弱的特点,提出一种结合同主题词对与FBTM的短文本分类算法,首先使用FBTM进行主题建模,将一段滑动窗口内的同主题词对作为特征扩充到原文本中,然后使用FBTM主题分布作为另一部分文本特征.对特征扩展后的Weibo语料库进行分类实验,结果显示该方法显著提高了分类性能.

关 键 词:滑动窗口词对  快速双词主题模型(FBTM)  采样  特征扩展  短文本分类
收稿时间:2017/3/2 0:00:00
修稿时间:2017/3/23 0:00:00

Application and Improvement of BTM in Short Text Classification Algorithm of the Same Topic
LIU Ze-Jin and WANG Jie.Application and Improvement of BTM in Short Text Classification Algorithm of the Same Topic[J].Computer Systems& Applications,2017,26(11):213-219.
Authors:LIU Ze-Jin and WANG Jie
Affiliation:Beijing Municipal Key Laboratory of Multimedia and Intelligent Software, Faculty of Information, Beijing University of Technology, Beijing 100124, China and Beijing Municipal Key Laboratory of Multimedia and Intelligent Software, Faculty of Information, Beijing University of Technology, Beijing 100124, China
Abstract:
Keywords:sliding window biterm  fast biterm topic model  sampling  feature expension  short text classification
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号