首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 0 毫秒
Deep Web查询接口的自动判定   总被引:5,自引:1,他引:5  
传统搜索引擎仅可以索引浅层Web页面.然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。  相似文献   

深层网数据库的访问方式主要是通过查询接口,所以查询接口是外部访问深层网数据库的门户.为了能够同时访问同一领域多个Web数据库,需要对多个Web数据库的查询接口进行集成.因此,提出基于本体的深层网查询接口集成方法.首先构建领域核心本体,在模式匹配过程中,不断完善核心本体;然后,以本体作为媒介,在不同查询接口模式间建立属性映射关系,发现属性间的语义关联;最后,根据本体概念出现的频数生成集成接口.实验表明提出的深层网查询接口自动集成方法是可行的和高效的.  相似文献   

传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面。由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口。文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性。  相似文献   

The amount of information contained in databases available on the Web has grown explosively in the last years. This information, known as the Deep Web, is heterogeneous and dynamically generated by querying these back-end (relational) databases through Web Query Interfaces (WQIs) that are a special type of HTML forms. The problem of accessing to the information of Deep Web is a great challenge because the information existing usually is not indexed by general-purpose search engines. Therefore, it is necessary to create efficient mechanisms to access, extract and integrate information contained in the Deep Web. Since WQIs are the only means to access to the Deep Web, the automatic identification of WQIs plays an important role. It facilitates traditional search engines to increase the coverage and the access to interesting information not available on the indexable Web. The accurate identification of Deep Web data sources are key issues in the information retrieval process. In this paper we propose a new strategy for automatic discovery of WQIs. This novel proposal makes an adequate selection of HTML elements extracted from HTML forms, which are used in a set of heuristic rules that help to identify WQIs. The proposed strategy uses machine learning algorithms for classification of searchable (WQIs) and non-searchable (non-WQI) HTML forms using a prototypes selection algorithm that allows to remove irrelevant or redundant data in the training set. The internal content of Web Query Interfaces was analyzed with the objective of identifying only those HTML elements that are frequently appearing provide relevant information for the WQIs identification. For testing, we use three groups of datasets, two available at the UIUC repository and a new dataset that we created using a generic crawler supported by human experts that includes advanced and simple query interfaces. The experimental results show that the proposed strategy outperforms others previously reported works.  相似文献   

一种基于语义Web服务的服务自动发现的实现   总被引:5,自引:0,他引:5  
服务自动发现的实现中的核心问题是服务的自动匹配和定位。该文提出的解决方案是采用owl-s profile来提供发布服务属性和功能描述的广告,构建基于ontology的服务搜索引擎,采取服务参数匹配和输入参数匹配的分级匹配方式,实现了基于概念推理的服务自动定位。介绍了基于该方法开发出的一个电子商务系统原型,描述了它的系统架构和实现机制,分析了该解决方案的可行性。  相似文献   

基于本体的Deep Web查询接口分类   总被引:1,自引:0,他引:1  
目前对于分类问题,主要工作集中在文本或Web文档的分类研究,而很少有对deep Web查询接口的分类研究.deep Web源包括查询接口和查询结果,大量的deep Web源的存在,对它们查询接口的分类是通向deep Web分类集成和检索的关键步骤.本分提出一种deep Web本体分类方法,包括:分类本体的概念模型和由此产生的deep Web空间向量模型(VSM).试验表明,这种分类方法具有良好的分类效果,平均准确率达到91.6%,平均查全率达到92.4%.  相似文献   

基于流程的Web服务发现   总被引:1,自引:0,他引:1  
支持基于流程的Web服务发现是提高企业集成度和灵活性的一个重要问题.由于Web服务的松散耦合环境,发现的Web服务流程未必完全相容.提出一个能够反映Web服务流程控制特点的流程模型tFSM,基于tFSM模型定义了Web服务流程的相容性和相容度,并给出一个计算Web服务流程相容度的算法.利用这些核心工作,可以实现一种基于流程的Web服务发现方法.  相似文献   

传统的Web服务发现技术大多采用基于关键字的服务匹配机制,缺乏对Web服务功能的语义性描述,影响了Web服务的查全率、查准率和查找的智能化.研究基于语义的Web服务匹配方法,在经典Web服务匹配算法的基础上进行改进,研究单概念语义Web服务匹配算法,并由此得出多概念语义Web服务匹配的最优顺序,结合输入、输出参数,最终得出语义Web服务匹配结果,实验结果表明,改进后的方法比BGM算法匹配度高.  相似文献   

潘颖  汤庸 《计算机研究与发展》2012,49(12):2549-2558
Web服务描述语言是基于模式优先(schema-first)的,Web服务发现方法需要花费较高的前期构建成本,目前的研究没有涉及如何在pay-as-you-go模式下发现Web服务这一问题.提出了一个基于数据空间技术的服务发现框架,支持pay-as-you-go模式下基于关键词匹配和基于相似度的Web服务发现.首先给出一个schema-later数据模型用于描述Web服务及其关系,并讨论了该模型的延迟计算和查询方法,该方法不必事先物化模型就可以提供查询服务;然后给出一个基于相似度的Web服务发现算法及其正确性证明,该算法将相似度看作是极松散结构模型的虚拟边(关系),在计算相似度之前,通过延迟计算得到需要进行比较的服务节点集及其信息,以便在pay-as-you-go模式下计算相似度;最后通过实验表明该方法是可行和有效的.  相似文献   

本文主要描述了JSF技术产生的原因,JSF技术是什么,如何运用JSF技术,以及JSF对于我们有何用处.  相似文献   

提出一种生物信息二级数据库的构建模式:B/S模式下,首先依据约束规则对各类异质数据进行有效收集,然后对收集的数据尤其是半结构化数据进行解读,进而利用关系数据库管理系统对数据进行存储、管理和维护,通过JSP与JDBC技术提供对数据库的公共访问。据此构建了硒蛋白相关生物信息二级数据库,提供经过加工、分类和整理的硒蛋白相关生物信息。验证了本构建模式的有效性,为探索生物信息二级数据库的构建积累了经验。  相似文献   

Toward Quality-Driven Web Service Discovery   总被引:1,自引:0,他引:1  
Service-oriented architectures follow the find-bind-execute paradigm, in which service providers register their services in public or private registries, which clients use to locate Web services. If a service registry has information on a service that matches a client's criteria, it provides a contract and an access point. Web service discovery is a key component in service-oriented computing. However, without Web service quality standards and quality-based discovery mechanisms, the trustworthiness of business-to-business interactions can't be guaranteed.  相似文献   

基于信誉的语义Web服务发现   总被引:1,自引:0,他引:1  
服务发现在语义Web领域是一个挑战性问题.一个关键问题是发现满足用户功能需求的最佳服务.同样重要的是,电子商务应用还要求发现满足QoS需求的最佳服务.由此提出一个基于信誉管理的分布式服务选择框架.它主要有以下特点:用一个结构化的覆盖网络作为分布式服务存储系统来提高系统的有效性和可扩展性; 提出一个QoS感知的语义Web服务发现方法,并给出基于用户反馈的分布式信誉度评估算法.最后用一个例子示范算法如何解决实际问题.  相似文献   

Since its emergence in the early 1990s, the WWW has become not only an information system of unprecedented size, but a universal platform for the development of services and applications. However, most of the advances in web technologies are intended for professional developers, paying poor attention to end-users with no programming abilities but with explicit needs of creating and customizing web-based presentations. This provides a strong motivation for end-users to act as designers at some point, leading to an emerging role of new computing-related professionals to be considered. This paper is an effort to leverage such difficulties by providing intelligent mechanism to assist end-users in web-based authoring tasks. To carry out such a challenge, intelligent user-monitoring techniques are exploited to obtain high-level information that will be used to infer the user’s preferences and assist him throughout the interaction. Furthermore, we report on how iteration patterns can be applied to avoid repetitive tasks that are automatically carried out on behalf of the user. In order to bring off a feasible trade-off between expressivity and ease of use, a user experiment to obtain the user’s perception and evaluate the hit-rate of our system is also presented.  相似文献   

There are hidden and rich information for data mining in the topology of topic-specific websites. A new topic-specific association rules mining algorithm is proposed to further the research on this area. The key idea is to analyze the frequent hyperlinked relati ons between pages of different topics. In the topic-specific area, if pages of onetopic are frequently hyperlinked by pages of another topic, we consider the two topics are relevant. Also, if pages oftwo different topics are frequently hyperlinked together by pages of the other topic, we consider the two topics are relevant.The initial experiments show that this algorithm performs quite well while guiding the topic-specific crawling agent and it can be applied to the further discovery and mining on the topic-specific website.  相似文献   

web服务的大量涌现对服务发现提出了挑战.然而,传统的服务发现技术是建立在语法描述的基础上,主要采用的服务发现机制是WSDL和UDDI规范相结合的解决方案,通过关键词匹配来实现的.但是这些发现方法查准率极其低下,已经不能很好地满足用户需要.在研究本体与语义Web服务的基础上,提出了一种基于本体的Web服务发现框架,该框架首先对用户的请求合约进行语义预处理,然后根据抽取的语义在服务库中发现适合的web服务,从而提高查准率.  相似文献   

Web服务的大量涌现对服务发现提出了挑战。然而,传统的服务发现技术是建立在语法描述的基础上,主要采用的服务发现机制是WSDL和UDDI规范相结合的解决方案,通过关键词匹配来实现的。但是这些发现方法查准率极其低下,已经不能很好地满足用户需要。在研究本体与语义Web服务的基础上,提出了一种基于本体的Web服务发现框架,该框架首先对用户的请求合约进行语义预处理,然后根据抽取的语义在服务库中发现适合的Web服务,从而提高查准率。  相似文献   

基于本体的语义Web服务QoS描述和发现   总被引:1,自引:0,他引:1  
WS-QMO是提出的一个用来对Web服务及其QoS信息进行建模和发现的顶层本体,它既可用于对服务QoS信息的描述和发布,也可用于对服务QoS需求的描述.WS-QMO本体基本满足了当前对Web服务QoS语义建模的普遍要求,并且由于适当地加入SWRL规则,它不但可以灵活地自定义单个QoS属性,描述一个QoS属性在不同条件下的不同取值,还可以定义复杂的组合QoS属性.相对同类本体或描述语言,它能更好地描述具有复杂约束规则的QoS属性,同时尽量利用现有的成熟规范使其定义式更为简洁.最后给出了基于该本体的QoS知识库的管理方法以及一个新的自动服务发现算法,该算法仅使用描述逻辑推理机的功能便可实现复杂约束的QoS自动服务发现,使得基于WS-QMO的Web服务建模和发现同时具备较好的描述能力和执行效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号