首页 | 本学科首页   官方微博 | 高级检索  
     

数据ETL过程中的实体识别方法
引用本文:彭银桥,甘元驹,邓锐,彭凌西.数据ETL过程中的实体识别方法[J].信息技术,2005,29(2):22-24.
作者姓名:彭银桥  甘元驹  邓锐  彭凌西
作者单位:湛江海洋大学信息学院,湛江,524088
摘    要:实体识别是根据记录所包含的各种描述信息来确定与之相对应的现实实体,记录的相似匹配是数据集成中最具挑战的工作。分析了常见实体识别算法,提出了实体识别过程框架,用以实现数据ETL的数据规约功能。在开发的实现了语义数据集成的联通统一客户资料系统(UCIS)中,用实体识别算法进行测试,得到的平均返回率和精度分别为86.3%,96.5%,能够满足工程应用的要求。

关 键 词:数据ETL  相似重复记录  实体识别算法  实体识别过程框架
文章编号:1009-2552(2005)02-0022-03
修稿时间:2004年7月13日

Entity identification method for data ETL process
PENG Yin-qiao,GAN Yuan-ju,DENG Rui,Ling-xi.Entity identification method for data ETL process[J].Information Technology,2005,29(2):22-24.
Authors:PENG Yin-qiao  GAN Yuan-ju  DENG Rui  Ling-xi
Abstract:
Keywords:data ETL  duplicate records  entity identification algorithms  entity identification process frame
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号