首页 | 本学科首页   官方微博 | 高级检索  
     

基于双向路径约束模型的XML文档结构相似性度量
引用本文:廉鑫,林伟坚,张海威,袁晓洁. 基于双向路径约束模型的XML文档结构相似性度量[J]. 计算机研究与发展, 2010, 47(Z1)
作者姓名:廉鑫  林伟坚  张海威  袁晓洁
作者单位:南开大学数据库与信息系统实验室,天津,300071
基金项目:国家"八六三"高技术研究发展计划基金项目 
摘    要:为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML文档的结构信息,为更精确的XML相似度计算打下基础.引入自然语言领域中成熟的N-Gram思想,将基于N-Gram的划分方式应用在路径约束相似度计算中,加快了计算效率和精确度.运用正整数和各种权值简化N-Gram信息的提取和运算.实验结果表明,方法提高了聚类的准确率和召回率.

关 键 词:文档相似度  双向路径约束模型

Similarity Evaluation Between XML Documents Based on Bidirectional Path Constraint Model
Lian Xin,Lin Weijian,Zhang Haiwei,Yuan Xiaojie. Similarity Evaluation Between XML Documents Based on Bidirectional Path Constraint Model[J]. Journal of Computer Research and Development, 2010, 47(Z1)
Authors:Lian Xin  Lin Weijian  Zhang Haiwei  Yuan Xiaojie
Abstract:
Keywords:XML  N-Gram
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号