首页 | 本学科首页   官方微博 | 高级检索  
     

结合属性分布特征的模式匹配算法
引用本文:王宇,方滨兴,吴博,宋林海,郭岩.结合属性分布特征的模式匹配算法[J].中文信息学报,2010,24(3):89-97.
作者姓名:王宇  方滨兴  吴博  宋林海  郭岩
作者单位:1. 中国科学院 计算技术研究所智能信息与智能安全中心, 北京 100190
2. 中国科学院 研究生院, 北京 100190
基金项目:国家863高技术研究发展计划资助项目(2007AA01Z438);;国家242信息安全计划资助项目(2009A19,2009A91)
摘    要:该文提出了一种结合属性分布特征的Web模式匹配算法,属性分布特征包括属性对互斥特征和属性对共现特征。属性对互斥特征由属性对的互斥性和出现次数计算得出,这个特征隐含了属性对的语义相似程度。为了充分利用传统的属性名、属性值相似性特征,该文通过机器学习方法结合属性对互斥特征与相似性特征进行属性匹配。并以潜在的匹配属性对为基础,引入有约束的属性聚类方法进行Web模式匹配,聚类方法的约束条件来自属性对共现特征。实验结果表明,相对于仅使用相似性特征的方法,在不同的实验设置下,结合属性分布特征的Web模式匹配算法将F值提高了0.13到0.55。

关 键 词:计算机应用  中文信息处理  属性对互斥  属性对共现  Web模式匹配  约束聚类  

Schema Matching Incorporating Attribute Distribution Features
WANG Yu,FANG Binxing,WU Bo,SONG Linhai,GUO Yan.Schema Matching Incorporating Attribute Distribution Features[J].Journal of Chinese Information Processing,2010,24(3):89-97.
Authors:WANG Yu  FANG Binxing  WU Bo  SONG Linhai  GUO Yan
Affiliation:1. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate University of Chinese Academy of Sciences, Beijing 100190, China
Abstract:This paper presents a new web schema matching algorithm incorporateing attribute distribution features.Attribute distribution features include the mutually exclusive feature and the co-occurring feature.By discovering mutually exclusive attribute pair and various statistics of the attribute pair,the mutually exclusive feature is calculated with the implication of the semantic similarity of the attribute pair.To utilize name similarity and value similarity based features,the attribute distribution features a...
Keywords:computer application  Chinese information processing  mutually exclusive attributes  go-occurring attributes  web schema matching  constrained clustering  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号