基于语言无关性语义Kernel学习的短文本分类 |
| |
作者单位: | ;1.四川工程职业技术学院计算机科学技术系 |
| |
摘 要: | 针对传统的短文本分类方法大量使用语法标签和词库导致产生语言依赖的问题,提出一种基于语言无关性语义核学习的短文本分类方法。首先,利用短文本的语义信息从文档中提取模式;然后,以三个标注层(词、文档和类别)标注提取出的每个模式;最后,根据三个标注层次计算文档之间的相似度,并根据相似度完成分类。在英语和汉语数据集上的实验验证了该方法的有效性。实验结果表明,相比其他几种核方法,该方法取得了更好的分类性能。
|
关 键 词: | 短文本分类 语义核学习 相似性度量 语言无关性 标注层 模式语义标注 |
SHORT-TEXT CLASSIFICATION BASED ON LANGUAGE-INDEPENDENT SKL |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|