首页 | 本学科首页   官方微博 | 高级检索  
     

基于主题分布优化的模糊文本分类研究
引用本文:梁艳红,坎启轩,苏翌. 基于主题分布优化的模糊文本分类研究[J]. 计算机工程, 2019, 45(10): 221-226
作者姓名:梁艳红  坎启轩  苏翌
作者单位:河北工业大学人工智能与数据科学学院,天津,300401;河北工业大学人工智能与数据科学学院,天津,300401;河北工业大学人工智能与数据科学学院,天津,300401
基金项目:国家自然科学基金;河北省博士后科研项目;京津冀协同创新共同体建设专项
摘    要:在对类别模糊的文本进行分类时,主题模型只考虑文档和主题级别信息,未考虑底层词语间的隐含信息,且多数主题信息复杂、中心不明确。为此,提出一种改进的文本分类方法。通过分位数选择中心明确的主题,将其映射到word2vec词向量空间内,对模糊文本进行分类操作,进而得到文本分类结果。实验结果表明,与C_LCD+KNN方法相比,该方法分类效果较好,鲁棒性较强。

关 键 词:主题模型  词向量  模糊文本  语义分析  分位数

Research on Fuzzy Text Classification Based on Topic Distribution Optimization
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号