首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
OAI协议的飞速发展促使了仓储数目的不断增大,导致服务提供者在短时间内无法及时收割数据提供者仓储更新的元数据记录.文中将RSS技术应用到OAI协议中,提出了一种OAI框架中元数据同步问题的解决方法.该方法以XSLT为基础,将数据提供方的元数据记录转换为对应的聚合文件(RSS1.0和RSS2.0),利用RSS技术的即时性、标准统一、易于整合等特点,有效地维护了数据提供方和服务提供方元数据的同步,从而实现了两方信息的同时更新并提高了信息的利用率.  相似文献   

2.
对RSS元数据的产生、发展以及在门户网站中的运用情况进行简单介绍与分析,了解RSS元数据的特点以及在门户网站中起到的作用,分析门户网站在建设中遇到的问题及需求。  相似文献   

3.
首先从元数据的属性和元数据的粒度两个角度对科技文献元数据进行了分析,在此基础上,从科技文献元数据自动抽取的理论研究和应用实践研究两个方面对国内外科技文献元数据自动抽取研究成果进行分析和综合,最后指出了现有研究的特点和存在的不足.  相似文献   

4.
基于特征相似度的论文元数据抽取算法与传统的DOM树方法相比,提高了论文元数据的抽取成功率.但论文元数据的抽取效率却不高,而论文元数据的抽取与蜘蛛的论文爬取是同时进行的,对元数据的抽取有实时性要求,因此影响了论文数据量的增加.经过比较研究,利用决策树中的C4.5算法对特征相似度算法进行改进,论文元数据的抽取成功率提高了2%,抽取效率提高了62%.  相似文献   

5.
关注RSS安全问题   总被引:3,自引:0,他引:3  
RSS是一种轻型的、多用途的、可扩展的元数据描述和交换格式。由于RSS格式规范,使用方便,因此越来越多的网站提供对RSS的支持,越来越多的用户使用这种方式来获取最新消息,由此带来的安全问题值得关注。  相似文献   

6.
针对有向无环图支持向量机的元数据自动抽取机制问题进行了分析和研究,提出了基于此抽取机制和W3C资源描述框架的生物信息数据中的元数据(Meta-Data)自动抽取系统.有效地避免了分类重叠问题和抽取数据统一标记问题,为生物信息系统面向语义网应用扩展提供了整合数据基础.该自动抽取系统在生物信息系统面向语义网中具有广泛的应用前景.  相似文献   

7.
提出一种从科技文献等文档中自动抽取元数据的方法,将自动归纳法和相似特征度算法结合起来,基于特征相似的归纳学习算法自动生成抽取规则,并对文档进行元数据的自动抽取。这种方法利用文档自身某些特有属性,对文档的内容进行分块,利用归纳法自动生成抽取规则,并结合特征相似度对生成规则进行匹配,然后对文档元数据信息进行自动抽取,提高了自动生成规则的效率和抽取元数据信息的准确率。  相似文献   

8.
李艳  郝大鹏  徐行 《微机发展》2014,(2):234-236,241
文中研究了图书馆信息服务。信息服务呈现多元化、个性化的趋势,根据需求定制服务十分重要,图书馆信息可以重复利用是服务定制的保障。提出元数据信息发布平台设计方案,发布平台利用中国机读目录抽取信息,并结合互熵一信息检索方法提高抽取信息的正确性,抽取的信息以元数据形式存储,通过OAI协议发布。给出发布平台的应用实例,说明信息发布平台如何为毕业设计过程管理系统提供数据服务。  相似文献   

9.
RSS订阅是web2.0时代的特征之一,本文介绍了RSS的含义及特点,论述了RSS的实现方法,并通过在自身图书馆门户网站上实现开展RSS订阅服务的实践来阐明RSS的应用。  相似文献   

10.
基于CWM的企业元数据集成中元数据抽取与导出研究   总被引:1,自引:0,他引:1  
公共仓库元模型(CwM)是为了在数据仓库和业务分析环境之间方便交换元数据而制定的一个标准,并已经成为模型驱动体系结构(MDA)新策略方向中的核心组成部份。基于CWM的企业元数据集成相关技术,重点探讨集成中元数据的抽取与导出问题,给出相应的导出规则以及一个应用实例。  相似文献   

11.
The concept of metadata is briefly introduced and the benefits of exposing metadata for publishers and content providers are discussed. Various approaches for standardised exposure of metadata are described including; harvesting via OAT-PMH, distributed searching via Z39.50 & SRU/SRW, and exposure of content for syndication via RSS. Case studies are used throughout to provide illustrative examples of these methods in action and a range of typical concerns relating to metadata sharing issues are addressed.  相似文献   

12.
通过对RSS技术的深入研究,在J2EE的B/S应用架构下,设计开发了一个RSS在线阅读器。用Hibernate作为数据持久层,Struts作为视图和控制器部分,实现了层次间的松耦合,提高了代码的可重用性,增强了系统的灵活性、复用性和可维护性。  相似文献   

13.
14.
The phenomenon known as Web logging (“blogging”) has helped realize an initial goal of the Web: to turn Web content consumers (i.e., end users) into Web content producers. As the Semantic Web unfolds, we feel there are two questions worth posing: (1) do blog entries have semantic structure that can be usefully captured and exploited? (2) Is blogging a natural way to encourage growth of the Semantic Web? We explore empirical evidence for answering these questions in the affirmative and propose means to bring blogging into the mainstream of the Semantic Web, including ontologies that extend the RSS 1.0 specification and an XSL transform for handling RSS 0.9x/2.0 files. To demonstrate the validity of our approach we have constructed a semantic blogging environment based on Haystack. We argue that with tools such as Haystack, semantic blogging will be an important paradigm by which metadata authoring will occur in the future.  相似文献   

15.
RSS技术及其发展探讨   总被引:2,自引:0,他引:2  
互联网的发展使得网络成为人们重要的信息来源,但传统的浏览方式存在一定不足。一种新的浏览技术RSS在近年来迅速发展,越来越多的Web站点为用户提供基于RSS的浏览方式。文中对RSS技术的各个方面做一个综述,分析了RSS的由来及发展状况,给出了RSS不同版本之间的对比;介绍了RSS技术的工作原理及其与传统的浏览方式的区别。对RSS的优点及应用领域作一个探讨,简单讨论了RSS的一些不足。作为一种新的网络浏览方式,RSS存在优点的同时存在一定的不足,但其将来必定会越来越完善。  相似文献   

16.
RSS是一种简易的XML格式,用以发布经常更新内容的信息,在互联网上得到了广泛的应用。通过对RSS应用特点的分析以及RSS技术的研究,该文主要讨论了RSS个性化聚合系统的设计思路和实现方法。该RSS聚合系统采用目前较为流行的Sil-verlight富互联网应用技术,并实现了RSS在线阅读器;站内外RSS资源的订阅、收藏、分享;站内RSS资源搜索以及为不提供RSS输出的站点创建RSS Feed等一系列功能。  相似文献   

17.
为了解决常规RSS服务离线环境下无法提供网络服务的问题,提出了一种新的基于RSS的离线数据库应用系统模型:RSS离线数据库的设计、数据提取、转换和访问的基本方法;并给出了离线RSS阅读的定义。该系统模型实现了在线服务的离线应用,扩展了RSS服务的应用方向,增强了RSS阅读器的适用性。  相似文献   

18.
孙彩杰  沈涤 《微机发展》2006,16(8):160-162
文中简要介绍了RSS的概念、发展历史,目前商用网站、博客以及图书馆网站中RSS的应用情况。分析了RSS的优点,并指出RSS技术能提高图书馆信息化程度、加强图书馆与读者的联系、提高图书馆员工的业务水平,描述了上海师范大学图书馆RSS阅读器的开发环境、设计过程,并通过程序说明RssReader类的定义和调用。  相似文献   

19.
RSS news articles that are either partially or completely duplicated in content are easily found on the Internet these days, which require Web users to sort through the articles to identify non-redundant information. This manual-filtering process is time-consuming and tedious. In this paper, we present a new filtering and clustering approach, called FICUS, which starts with identifying and eliminating redundant RSS news articles using a fuzzy set information retrieval approach and then clusters the remaining non-redundant RSS news articles according to their degrees of resemblance. FICUS uses a tree hierarchy to organize clusters of RSS news articles. The contents of the respective clusters are captured by the representative keywords from RSS news articles in the clusters so that searching and retrieval of similar RSS news articles is fast and efficient. FICUS is simple, since it uses the pre-defined word-correlation factors to determine related (words in) RSS news articles and filter redundant ones, and is supported by well-known and yet simple mathematical models, such as the standard deviation, vector space model, and probability theory, to generate clusters of non-redundant RSS news articles. Experiments performed on (test sets of) RSS news articles on various topics, which were downloaded from different online sources, verify the accuracy of FICUS on eliminating redundant RSS news articles, clustering similar RSS news articles together, and segregating different RSS news articles in terms of their?contents. In addition, further empirical studies show that FICUS outperforms well-known approaches adopted for clustering RSS news articles.  相似文献   

20.
对RSS的沿革及发展进行论述,对比不同时期不同版本的RSS技术,就RSS存在的问题和前景进行分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号