期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何晶晶蔡德胜介飞吴共庆《计算机应用研究》2018,35(5)

针对现实中同一实体存在不同表象的问题,提出一种基于D-S证据理论特征融合的同义实体识别方法。以搜索引擎为外部知识库获取实体特征信息,利用相似函数计算特征值,由D-S证据理论融合n个特征值,经阈值判断完成同义实体的识别。特征融合识别算法在医疗机构数据集上的识别精度、召回率和F值分别达到了85.80%、81.18%、83.43%,比单纯利用实体名的算法分别提高了4.09%、4.30%和4.21%。实验表明D-S证据理论将多特征融合,对同义实体识别具有更好的识别效果。相似文献

2.

基于结构分析和实体识别的信息集成 总被引：4，自引：0，他引：4

苏志华杨冬青唐世渭王腾蛟《计算机研究与发展》2004,41(10):1823-1828

针对海量的web数据,提出了一种基于文档结构分析和实体识别的web信息提取和集成方法,利用XML强大的数据描述能力,灵活组织集成的web文档信息内容．方法首先将半结构化的HTML文档转化成具有模式结构的XML文档,然后使用实体识别的技术对不同主题区域进一步抽取出格式良好的数据,最后将得到的多数据类型的信息集成到数据库中,以支持进一步的分析和查询．实验结果证明了该方法的实用和有效性．相似文献

3.

信息集成中的实体识别解决方案 总被引：1，自引：0，他引：1

周建芳徐海银卢正鼎《小型微型计算机系统》2009,30(9)

分析了实体识别过程中存在的问题,并在基于本体的语义信息集成中模式异构和上下文异构已经得到解决的基础上,提出一个基于两阶段特征向量处理的解决方案来提高分布环境下实体识别的效率.最后针对实体识别中比较函数主要考虑英文字符串特点导致中文字符串精度较低的特点设计了一个基于公共子串的比较函数,实验证明该函数与基于编辑距离的比较函数比较,具有更高的查全率、查准率和更低的时间复杂度. 相似文献

4.

基于同义词典的装备信息集成应用研究

王盼卿刘增良陶源《微计算机信息》2009,25(9)

本文分析了信息化条件下我军装备信息系统集成中存在的数据不同一的问题,介绍了数据同义词典(thesaurus)的定义与设计方法,说明了数据同义词典在装备信息系统设计中的作用,提出了基于数据词典的装备信息系统数据交互的实现方式,表明了充分利用已有的信息系统资源,采用基于XML的数据词典方式解决装备信息系统集成中异构数据问题的优势. 相似文献

5.

基于BP神经网络的Deep Web实体识别方法

徐红艳党晓婉冯勇李军平《计算机应用》2013,33(3):776-779

针对现有实体识别方法自动化水平不高、适应性差等不足,提出一种基于反向传播(BP)神经网络的Deep Web实体识别方法。该方法将实体分块后利用反向传播神经网络的自主学习特性,将语义块相似度值作为反向传播神经网络的输入,通过训练得到正确的实体识别模型,从而实现对异构数据源的自动化实体识别。实验结果表明,所提方法的应用不仅能够减少实体识别中的人工干预,而且能够提高实体识别的效率和准确率。相似文献

6.

Web信息集成的研究

陈砚雄《数字社区&智能家居》2005,(8):29-31

在信息和服务迅猛增长的Web上构建信息集成系统是当前的一个研究热点，本文针对web信息集成的目标，结合XML和RDF等主要的Web技术及本体的概念，构建了一个基于本体的查询-应答框架，它通过有效地集成Web上的各种异构数据源来为终端用户提供更为方便的服务和应用。相似文献

7.

一种基于语义及统计分析的Deep Web实体识别机制 总被引：1，自引：0，他引：1

下载免费PDF全文

寇月申德荣李冬聂铁铮《软件学报》2008,19(2):194-208

分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性. 相似文献

8.

多Web数据源环境下的重复实体识别方法研究

刘伟肖建国《计算机科学与探索》2010,4(7):599-607

Web中大量可访问的数据源为人们获取有用的信息带来了极大的便利。作为Web数据源集成的一个必要的步骤,需要将存在于不同数据源表达形式各异的重复Web实体准确地识别出来。在已有的重复实体识别的工作中,主要是在两个数据源之间进行。由于Web数据源数量众多,使得这些方法无法应用于多个Web数据源之间的重复实体识别。针对这个问题提出了一种基于迭代训练的Web重复实体识别方法,可以在较小规模的训练样本上实现在多个Web数据源上的重复实体识别。通过在图书和计算机产品两个不同领域中多个Web数据源上的广泛实验,表明了提出方法的有效性。相似文献

9.

基于同义扩展的在线百科中实体属性抽取

刘倩刘冰洋贺敏伍大勇刘悦程学旗《中文信息学报》2016,30(1):16-24

实体属性抽取是信息抽取、知识库构建等任务的重要基础。该文提出了一种利用在线百科获取实体属性的方法,该方法首先通过在线百科的结构特征和领域独立的抽取模式捕获可能的属性短语,然后根据同义扩展获取尽可能多的属性表述形式,并同时得到对应实体类别的同义属性集合。实验表明,该方法在保证属性抽取准确率不变的情况下,获得了比仅使用频率的方法覆盖范围更广的实体属性集合。相似文献

10.

基于Web Services的供应链管理信息集成

张中秋《数字社区&智能家居》2007,2(5):717-719

介绍了在当前供应链的环境下,成员信息集成交互的重要性,指出了传统的一些分布式信息集成技术的不足,给出了在Web Services技术下供应链信息集成的框架、方案,并指出Web服务的技术优势,在实现异构平台的企业间信息交互的可行性和优点。该方案可以有效的满足供应链信息集成的要求。相似文献

11.

一种具有属性集成/融合能力的搜索策略*

吴早亮孟莉徐凌宇李严黄文涛《计算机应用研究》2008,25(1):87-89

针对搜索结果数量过多、各信息源--网页的属性值不一致的特点,提出一种具有属性融合/集成能力的搜索策略,拟建立自动搜索生成系统取代人工分拣.通过对检索出来的网页作信息抽取、对比、统计,进行集成/融合,最终提交给用户统一的信息视图,保证了信息完备性与权威性.用该方法建立的微机性能/报价检索示范系统的试运行与测试数据表明,该系统基本能够从繁重的人工检索中解脱出来,提高了自动化程度. 相似文献

12.

一种并行Web信息采集系统模型

杨天奇周晔《计算机应用》2007,27(1):225-227

根据国内外在信息采集领域的发展以及并行采集技术的研究,提出了一个基于多线程并行的Web信息采集结构模型,该模型以线程并行的方式对Web页面同时采集,实现了全面、高效并且灵活的信息搜集。相似文献

13.

生活服务领域垂直搜索引擎的设计与实现

汲业陈燕杨健慕蓉《计算机工程》2010,36(24):24-26

根据生活服务领域网页信息的特点,提出一种面向生活服务领域的垂直搜索引擎模型,给出该模型在信息采集、信息抽取、索引建立和信息检索4个功能模块的具体算法及实现方式。实际应用表明,该模型搜索效果良好,提供HTML和WML 2种方式的用户界面,已经成功覆盖全国近40个城市的餐饮、娱乐和黄页信息。相似文献

14.

Web服务搜索技术综述

关佶红许红儒周水庚《计算机与生活》2010,(5):385-400

随着Web服务应用的迅速发展与日益普及,如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括：基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上,指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。相似文献

15.

Web服务搜索技术综述* 总被引：1，自引：0，他引：1

关佶红许红儒周水庚《计算机科学与探索》2010,4(5):385-400

随着Web服务应用的迅速发展与日益普及, 如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括：基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上, 指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。相似文献

16.

Web信息检索研究进展 总被引：90，自引：3，他引：90

王继成萧嵘孙正兴张福炎《计算机研究与发展》2001,38(2):187-193

Ｗeb上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对Ｗeb的检索工作已经成为一基项重要的研究课题,但是,繁多的Ｗeb信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便。同时,有关Ｗeb信息检索最新技术的比较完整的分析又十分缺乏。在此,对Ｗeb信息检索技术进行了综述,从Ｗeb信息检索系统的层次化分类（搜索引擎与目录、元搜索引擎、信息检索agent)、一般机制和关键新技术（基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈）等方面加以阐述,以期对感兴趣的同行有参考作用。相似文献

17.

数据网格中信息服务技术的研究与实现*

杨辉南凯马永征阎保平《计算机应用研究》2007,24(7):246-248

针对传统数据网格信息服务的不足之处,在分析Web搜索引擎技术和基于关键词的数据库索引技术基础之上,结合这两种信息获取技术,设计了数据网格中结构化数据资源发现技术的体系结构.在科学数据网格信息服务系统中,利用开源Lucene全文检索软件包,实现了结构化数据资源发现的关键技术. 相似文献

18.

Zheng Xu Xiangfeng Luo Jie Yu Weimin Xu 《Concurrency and Computation》2011,23(18):2496-2510

Semantic similarity measures play important roles in many Web‐related tasks such as Web browsing and query suggestion. Because taxonomy‐based methods can not deal with continually emerging words, recently Web‐based methods have been proposed to solve this problem. Because of the noise and redundancy hidden in the Web data, robustness and accuracy are still challenges. In this paper, we propose a method integrating page counts and snippets returned by Web search engines. Then, the semantic snippets and the number of search results are used to remove noise and redundancy in the Web snippets (‘Web‐snippet’ includes the title, summary, and URL of a Web page returned by a search engine). After that, a method integrating page counts, semantics snippets, and the number of already displayed search results are proposed. The proposed method does not need any human annotated knowledge (e.g., ontologies), and can be applied Web‐related tasks (e.g., query suggestion) easily. A correlation coefficient of 0.851 against Rubenstein–Goodenough benchmark dataset shows that the proposed method outperforms the existing Web‐based methods by a wide margin. Moreover, the proposed semantic similarity measure significantly improves the quality of query suggestion against some page counts based methods. Copyright © 2011 John Wiley & Sons, Ltd. 相似文献

19.

总被引：2，自引：0，他引：2

下载免费PDF全文

王继成金翔宇杨晓江张福炎《计算机科学技术学报》2000,15(6):0-0

A masss of heterogeneous,distributed and dynamic information on the World Wide Web(the Web) has resulted in “information overload“ .It‘s an important and urgent reserach issue to provide users with effective information retrieval service on the Web.Web search enginees attempt to solve this problem,yet their effect is far from satisfying.In this paper,a distributed and cooperative strategy for information retrieval on the Web is proposed to substitute the centralized mode adopted by the current search engines.Then a new information retrieval system model IRSM is presented.which supports the retrieval of metadata about web documents and uses Z39.50 standard protocol to unify the heterogeneous interfaces of uments and uses Z39.50 standard protocol to unify the heterogeneous interfaces of different systems.Based on that,a distributed and cooperative information refieval framework,called DCIRF,is designed to help users in fast and effective information retrieval on the Web. 相似文献