数据空间中一种灵活的集合式实体识别框架 |
| |
引用本文: | 杨丹,申德荣,聂铁铮,于戈,寇月.数据空间中一种灵活的集合式实体识别框架[J].小型微型计算机系统,2015(3):418-423. |
| |
作者姓名: | 杨丹 申德荣 聂铁铮 于戈 寇月 |
| |
作者单位: | 辽宁科技大学软件学院;东北大学信息科学与工程学院 |
| |
基金项目: | 国家自然科学基金项目(61003060)资助;中央高校基本科研业务费专项资金项目(N110404010,N120316001)资助 |
| |
摘 要: | 数据空间是一个异构、动态的环境,具有随时间演化的特性.针对数据空间中随时间演化的、彼此间具有相互关联关系的大量异构实体,提出一个灵活的、基于演化的集合式实体识别框架TE-CER.TE-CER在实体识别过程中考虑时间信息和演化的影响,提出基于时间的blocking算法T-blocking和基于时间演化的聚类算法TE-Clustering.TE-Clustering聚类算法考虑了演化对实体相似度的影响,在相似度度量中引入属性演化系数和关联关系演化系数;在聚类过程中引入簇的时间约束.并且TE-CER提出基于识别顺序依赖图来确定集合式实体识别的识别顺序的策略,这样一种实体的识别结果可以用来后续另一种相关联实体的识别证据,以提高识别的准确率.在真实数据集上的大量实验结果表明所提出方法的有效性.
|
关 键 词: | 数据空间 时间演化 集合式实体识别 |
本文献已被 CNKI 等数据库收录! |
|