基于子树匹配的文本相似度算法 |
| |
引用本文: | 张佩云,陈传明,黄,波.基于子树匹配的文本相似度算法[J].模式识别与人工智能,2014(3):36-44. |
| |
作者姓名: | 张佩云 陈传明 黄 波 |
| |
摘 要: | 为降低文本向量维度,提高文本间语义相似度度量性能,综合利用统计方法与语义词典的优势,提出一种文本相似度算法.基于文本生成元数据特征向量,减少向量空间维度,设计基于子树匹配的文本相似度算法,借助子树加速对文本相似度的计算,并通过将文本元数据特征向量与子树进行相似度语义匹配,提高文本相似度计算时语义相似度度量的准确性.该算法考虑到对元数据中同义词的语义理解,加强文本之间相似度度量时的语义覆盖能力.实验结果表明文中所提出的方法是可行和有效的.
|
关 键 词: | 元数据 子树匹配 语义 文本相似度 |
本文献已被 CNKI 等数据库收录! |
|