排序方式: 共有12条查询结果,搜索用时 15 毫秒
11.
基于特征相似度的科技论文元数据提取算法研究 总被引:3,自引:1,他引:2
通过对论文元数据网页的分析发现论文摘要页面的各种元数据在长度、前置引导词、分隔符等方面都具有特定的规律,并据此提出了基于元数据特征的元数据抽取算法,归纳出了论文元数据的7个形式特征和2个语义特征,定义了确定特征和排除特征,描述了特征相似度算法的6个步骤,给出了分别采用正则表达式方法和特征相似度方法的试验结果,测试表明,采用特征相似度方法的提取成功率从68%提高到了95%,达到了实用水平. 相似文献
12.
论文以一个企业的信息集成项目为背景,在Domino平台上进行二次开发时,对平台上附带的数据集成工具DECS(企业连接器)进行了研究,分析了它存在的不足,开发了新的异构信息集成接口库,用以改进Domino自身的数据集成能力。此异构信息集成接口库的设计和实现,为在Domino平台上进行异构信息集成系统开发的企业和单位提供了一种新的思路和方法。 相似文献