首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的XML向量空间模型及其近似匹配算法
引用本文:王桐,刘大昕,田迪,孙伟,张万松.一种改进的XML向量空间模型及其近似匹配算法[J].计算机研究与发展,2006,43(Z3).
作者姓名:王桐  刘大昕  田迪  孙伟  张万松
摘    要:XML已成为网上数据交换和存储的标准,然而现有的XML文档模型存在很多问题.综合了数据挖掘和信息检索两方面的技术,对传统的向量空间模型加以扩展,提出一种新的基于语义和支持度的XML向量空间模型并给出其生成算法,该模型抽取文档集的频繁路径作为特征,然后利用XML本身的语义特性,对标签之间作ontology判断.最后,基于该模型提出一种XML近似查询算法,将文档矩阵从改进的VSM空间映射到潜在语义空间,并在转换后的空间获得近似查询结果并排序.对提出的方法进行理论分析和实验验证,得到满意的结果.

关 键 词:向量空间模型  频繁序列

An Improved XML Vector Space Model and Its Approximate Match Algorithm
Wang Tong,Liu Daxin,Tian Di,Sun Wei,Zhang Wansong.An Improved XML Vector Space Model and Its Approximate Match Algorithm[J].Journal of Computer Research and Development,2006,43(Z3).
Authors:Wang Tong  Liu Daxin  Tian Di  Sun Wei  Zhang Wansong
Abstract:
Keywords:XML  LSI
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号