首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
传统基于C/S模式的Web搜索方法对网络带宽和网络通畅性的要求都比较高,因此在当今互联网的海量数据中的检索效率比较低。在分析移动Agent技术特点的基础上,提出一种基于移动Agent的分布式Web搜索模型。该模型根据中文信息搜索的特殊性,将移动Agent技术与分类算法相结合,在搜索过程中引入了用户输入信息的预处理过程来进行信息分类,然后根据分类结果形成基于用户兴趣度的移动Agent搜索路径选择策略以及并发方法,由此来提高Web搜索的效率。详细介绍框架的组成和所采用的关键技术,并通过一个移动Agent的开发平台——Aglet平台对模型进行实现和实验。实验结果表明,采用该模型进行Web检索,比传统的C/S检索方式减少50%以上的搜索时间,而在各资源服务器存储的文件资源类别和资源数量差异较大情况下的搜索效率比非并发的其他移动Agent搜索模型搜索时间要减少70%以上。  相似文献   

2.
音视频资源中包含的可检索信息少,而且通常访问粒度大,不利于对其检索和使用。基于Lucene全文搜索引擎构建了一个音视频资源检索系统。系统通过多种方式为音视频注入语义文字信息,标注音视频片段,在此基础上使用Lucene实现全文检索,同时结合数据库检索和增强的语义检索提高检索的效率。实验显示,检索的召回率、准确率和用户满意度都比较高。  相似文献   

3.
网格资源发现机制是目前网格领域中的一个热点研究问题。本文对已有的网格资源发现方法进行了分析,指出了这些方法存在的不足;提出了一种基于MLON结构的资源发现机制,将具有同一类型资源的网格信息结点组织在一起形成域,把结点数量较多的域通过类型粒度组织成层次形结构。该机制利用类型匹配路由的资源搜索技术将资源发现请求转发
发到资源所在的域,采用Topk技术在相应的域内找出与请求匹配的最佳的k个资源,从而改善了资源发现的性能,提高了用户的满意度。  相似文献   

4.
随着电力企业海量数字资源的日益增长,如何对多种媒体格式的数字资源进行统一管理并进行快速、准确的搜索是电力企业知识管理中面临的难点.传统的搜索方法主要是基于关键字匹配来查找并返回大量的信息,没有考虑语义信息和用户的个性化特征,因此无法为用户提供准确、个性化的学习资源,造成了学习资源和人力的严重浪费.为解决此问题,本文基于语义技术,用机器可处理的语义元数据描述各种异构资源,并提出了基于本体的电力知识跨媒体资源标注方法,可以有效的解决用户对多知识点联动检索的问题,实现了电力企业知识内部知识的转化和传递,最终实现知识的共享和重用.  相似文献   

5.
资源发现机制是目前网格领域中的一个热点研究问题.对已有的网格资源发现方法进行了分析,指出了这些方法存在的不足,提出了一种基于多层覆盖网络结构的资源发现机制,将具有同一类型资源的网格信息结点组织在一起形成域,把结点数量较多的域通过类型粒度组织成层次形结构.利用类型匹配路由的资源搜索技术将资源发现请求转发到资源所在的域,采用Topk技术在相应的域内找出与请求匹配的最佳的K个资源,从而改善了资源发现的性能,提高了用户的满意度.  相似文献   

6.
传统检索工具内部模型存在缺陷,改变搜索阈值会导致检索的查全率和查准率降低,因此设计基于向量空间模型的信息资源关键词智能检索工具。创建优化循环架构,优化处理关键词;计算优化后关键词与未知文档间的夹角,得到信息关键词,转换成特征向量矩阵形式,以空间向量模型为参照,完成检索时相关指标的关联匹配;根据检索工具的特点设计智能检索分布,完善模型转换过程,实现信息资源关键词智能检索工具的设计。实验测试结果显示:所设计检索工具可有效智能检索关键词,在搜索阈值增大时,其F值能保证在70%以上,检索性能更加稳定。  相似文献   

7.
在针对用户在Web上难以从海量的图书数字资源中找到符合需求的资料,本文设计实现了基于Web知识发现的图书数字资源个性化检索系统.该系统利用Web知识发现、智能代理、数据挖掘等技术,设计出用户登录模型、用户兴趣生成模块、优化搜索结果等模块,通过各模块的设计达成用户行为对兴趣度的影响,个性化模型的更新,以及搜索结果的处理,进一步提升了Web上图书数字资源的检索质量,期待通过本次研究,为同领域内的图书数字资源个性化检索服务的构建,提供一些有价值的参考资料.  相似文献   

8.
刘鹏  邹华 《软件》2012,(11):214-217
基于垂直搜索引擎设计思想提出的Web服务搜索引擎相比传统的UDDI服务发现方法能更好的满足用户对于Web服务查询的需求。随着服务搜索引擎技术的不断发展,如何评价其检索效果成为提高服务搜索质量的核心问题。本文提出了一种基于用户行为分析对Web服务搜索引擎进行自动性能评价的方法,并且根据Web服务特点,提出了基于QoS数据信息进行样例集合划分的方法。通过对用户的查询和点击行为分析,推导出针对特定查询集合的检索结果集合,并将两个集合之间自动建立映射。通过分析Web服务搜索引擎的搜索效果,评价本文提出的方法与人工标注的方法的对比,基于用户行为的评价算法能够对服务搜索引擎进行较客观的评价。  相似文献   

9.
袁柳  张龙波 《计算机应用》2010,30(12):3401-3406
针对已有Web文档语义标注技术在标注完整性方面的缺陷,将潜在狄里克雷分配(LDA)模型用于对Web文档添加语义标注。考虑到Web文档具有明显的领域特征,在传统的LDA模型中嵌入领域信息,提出Domain-enable LDA模型,提高了标注结果的完整性并避免了对词汇主题的强制分配;同时在文档隐含主题和文档所在领域本体概念间建立关联,利用本体概念表达的语义对隐含主题进行准确的解释,使文档的语义清晰化,为文档检索提供有效帮助。根据LDA模型可为每个词汇分配隐含主题的特征,提出多粒度语义标注的概念。在20news-group和WebKB数据集上的实验证明了Domain-enable LDA模型的有效性,并指出对文档进行多粒度标注有助于有效处理不同类型查询。  相似文献   

10.
在介绍所提出的统一抽象部件模型UACModel的基础上,作者给出了一种适合Web上使用的部件检索机制,该机制包括后台执行的部件搜索工具、部件信息索引为库、面向用户的检索工具等,其中部件搜索工具支持模糊URL,检索工具支持复杂查询。  相似文献   

11.
针对当前P2P系统中多数为媒体文件,而对应描述信息有限的问题,提出了一个通过Web信息挖掘来扩展语义的算法.同时提出了一个基于语义跳表的多层环网络结构,帮助用户进行相关内容推荐.实验表明,用本文所提出的方法,在消息量很小的情况下,与传统的基于中心服务器的检索精度很相近,具有实用价值.  相似文献   

12.
基于环球网(Web)的特点和用户在点对点(P2P)系统中搜索的习惯,提出了一个在P2P系统中对媒体文件自动生成索引的方法。该方法有效地解决了媒体文件描述符不足所带来的查询精度低的问题。同时,提出了一个在P2P系统中节点信息的更新策略。实验表明,描述符扩展后,媒体文件查询结果的准确率得到了显著的提高。  相似文献   

13.
正则表达式与XML配置文件相结合的数据提取   总被引:1,自引:0,他引:1  
针对特定搜索引擎的实际需求,需要从网站中提取有效的数据作为它的数据源.本文通过对网页内部结构的分析,利用正则表达式与XML配置文件相结合的方法,建立了基于特定网页的框架和规则的数据内容提取方法,并加以实现.该方法成功运用到多个信息提取系统中,实现了高效、准确的数据提取.  相似文献   

14.
随着Internet的迅猛发展,Web成为了人们获取信息的重要途径。但是,网页数量的与日剧增,信息量的爆炸式增长,也为人们的信息查询带来了不便。Web数据挖掘技术的引入提高了检索质量,特别是Web结构挖掘在搜索引擎中的应用,很好地帮助用户快速从搜索结果中锁定对自己真正有用的信息。本文对基于结构挖掘的排序算法进行了大量搜集分析,并进行了归纳总结。  相似文献   

15.
在建设微生物菌种资源平台的基础上, 设计开发微生物菌种资源数据库管理系统,实现基于内容的Web图像智能检索系统.该检索系统采用B/S体系架构,可根据微生物菌种文本信息或图像的形状、纹理和颜色特征进行检索,有效提高了微生物菌种图像信息搜索的查准率、查全率和查找速度.  相似文献   

16.
随着网络信息资源的迅速增加,对于主题Web文本信息的搜索与分类日益成为信息处理领域的一个重要问题。本文建立了一个面向化工领域的Web文本搜索与分类系统,该系统在crawler子系统搜集Web文档的基础上,利用支持向量机对网页进行二次分类,找出化工专业中文网页;然后利用向量空间模型,对分类好的专业网页进行多子类分类。与综合搜索引擎相比,具有速度快、搜索信息准确度高和具备学习能力的特点。  相似文献   

17.
基于用户行为分析的个人信息检索研究   总被引:1,自引:0,他引:1  
个人信息检索是指个人计算机上用户搜索个人信息(通常是文档)的过程,与互联网检索相比,个人信息检索能够利用的信息很少,这使得其检索结果的排序更加困难。该文通过考察计算机上的用户行为,对个人信息检索的排序问题进行深入的研究。该文考察的用户行为主要包括用户在检索系统中的查询行为和在计算机上的文件访问行为。该文一方面通过查询行为数据训练出结果排序函数,另一方面通过文件访问行为数据获取文件自身的权重,最后利用统计学习方法结合这两类行为的计算结果。实验结果表明,该文提出的方法好于传统的TFIDF排序方法。  相似文献   

18.
支持智能搜索的自扩展知识库模型的研究和设计*   总被引:1,自引:1,他引:0  
利用自然语言处理和理解技术,提出并实现了一种可以对网页中的中文信息进行处理,获取并存储知识,具有自我扩展特性和支持中文智能搜索功能的知识库系统模型。该知识库模型将语义Web技术与智能搜索技术结合,支持自然语言的搜索请求,采用OWL本体描述语言来表达知识,支持知识的应用与推理,具有一定的实用和研究价值。  相似文献   

19.
Jansen  Bernard J.  Goodrum  Abby  Spink  Amanda 《World Wide Web》2000,3(4):249-254
The development of digital libraries has enhanced the integration of textual and multimedia information in many document collections. The World Wide Web provides the connectivity for many digital library users. Studies exploring the searching characteristics of Web users are an important and a growing area of research. Most Web user studies have focused on general Web searching, regardless of subject matter or format. Little research has examined how Web users search for multimedia information. Our study examines users' multimedia searching on a major Web search service. The data set examined consisted of 1,025,908 queries from 211,058 users of Excite ®, a major Web search service. From this data set, we identified and analyzed queries for audio, image, and video queries. Our findings were compared to results from general Web searching studies. Implications for the design of Web searching services and interfaces are discussed.  相似文献   

20.
The enormous growth in information technology has revolutionized the way people can access information sources. Web search engines have played an important role to support what the user wants precisely and efficiently from the vast web database. Different from conventional search engine approaches, searching the structure of the web, where the answer comprises more than a single page connected by hyperlinks, needs to be meritoriously developed. We propose Linear Programming models in order to generate the optimal structured web objects searching for relevant web graphs. In the model, the web objects with node and edge weights that represent the ranking measures for Webpages and hyperlinks are devised to rank the relevance in terms of keyword vectors. We also developed a tree-filtering algorithm and top-k Steiner tree algorithm that is used to provide the search recommendations in practical applications. With real web databases, the experimental study shows that the LP approach outperforms the conventional search engines with respect to execution time and quality of results.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号