基于主题分布优化的模糊文本分类研究 |
| |
引用本文: | 梁艳红,坎启轩,苏翌. 基于主题分布优化的模糊文本分类研究[J]. 计算机工程, 2019, 45(10): 221-226 |
| |
作者姓名: | 梁艳红 坎启轩 苏翌 |
| |
作者单位: | 河北工业大学人工智能与数据科学学院,天津,300401;河北工业大学人工智能与数据科学学院,天津,300401;河北工业大学人工智能与数据科学学院,天津,300401 |
| |
基金项目: | 国家自然科学基金;河北省博士后科研项目;京津冀协同创新共同体建设专项 |
| |
摘 要: | 在对类别模糊的文本进行分类时,主题模型只考虑文档和主题级别信息,未考虑底层词语间的隐含信息,且多数主题信息复杂、中心不明确。为此,提出一种改进的文本分类方法。通过分位数选择中心明确的主题,将其映射到word2vec词向量空间内,对模糊文本进行分类操作,进而得到文本分类结果。实验结果表明,与C_LCD+KNN方法相比,该方法分类效果较好,鲁棒性较强。
|
关 键 词: | 主题模型 词向量 模糊文本 语义分析 分位数 |
Research on Fuzzy Text Classification Based on Topic Distribution Optimization |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|