首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 156 毫秒
Web/HTTP协议性能分析和改进的研究   总被引:4,自引:1,他引:3  
Web客户端和服务器间信息交换属于典型的事务处理类型,许多研究表明这种通信模式不能被TCP所有效地支持(特别是在高速网络的环境)。文中从优化通信模式、降低协议负担和细化并行粒度的角度出发,研究运输层协议支持Web应用的机制优化和策略改进,并分析快捷运输协议(XTP)支持Web应用的功能和性能优势,考虑上述方法与其它改进措施(如层次Cache等)的关系及现有协议体系的向后兼容性。  相似文献   

吴於茜 《计算机工程》2000,26(11):131-132,153
彩色管理是近几年新发展起来的颜色复制与传递技术,广泛应用于桌面电子出版系统(DTP)。随着Internet的发展,该技术被逐渐引入Web应用领域。该文在表明了目前在电子商务中存在的色彩问题之后,阐述了基于Web的彩色管理解决方案。  相似文献   

针对结构化P2P系统中由于动态性带来的路由性能低的问题,提出一种利用分群和缓存的路由改进算法,该算法重点考虑了位置信息的分群,同时采用了自适应内容缓存机制和自适应路径缓存机制。最后的实验表明,改进后的路由算法路由性能明显改善,查找成功率高,较好地适应了P2P网络的动态性。  相似文献   

可扩展并行Web Server集群技术   总被引:7,自引:0,他引:7  
采用并行Web Server集群技术实现高性能Web Server已经成为一种趋势。该技术具有性能高、可扩展性好、可靠性高、成本低等优点。本文介绍了我们研制的TH-Web Cluster的工作原理、组成结构和所采用的几种关键技术,并与现有的技术和方法进行了比较。本文还简要介绍了TH-Web Cluster上开发的两个应用系统TH-Web Digger(信息挖掘工具)和TH-Web Search(搜  相似文献   

WWW中缓存模型的优化设计   总被引:3,自引:0,他引:3  
王东 《计算机工程与设计》1998,19(2):61-64,F003
WWW提供了方便的手段来访问远程信息资源,对于Web用户而言,衡量Web服务质量的一个重要指标就是检索信息所花费的时间。缩短检索时间的途径很多,此文主要介绍通过设置缓存机制,降低用户对资源访问请求次数,达到缩短用户直观感觉上的检索时间的方法。并讨论一种基于C/S结构的缓存模型,提出了新的缓存替换算法,综合考虑了文档长度,网络负载等参数,实现了缓存模型的优化。经过实验验证,该算法优于目前的缓存替换算法。  相似文献   

把IIS的自动日志保存功能和ASP技术相结合,提出一种Web日志保存方案并予以实现。该方法能够更加全面地获取用户访问信息,为分析用户需求,改进Web站点网页结构提供了丰富的信息:用户访问信息直接存储在Web数据库,为基于Web信息的数据挖掘提供了数据源。该方法已在Web站点的设计和运行中得到实际应用。  相似文献   

缓存并不是一个复杂的概念,它指的是:把Web内 容移到靠近浏览者所在的地方,从而缩小由于网络延迟、服务器负载过重等造成的响应延迟。把Web内容放入本地硬盘是获得最佳缓存效果的理想方法:如果硬盘有足够大的空间存储整个Web(或至少存储整个目标网站),就永远不必再等待页面的装载了。然而,这是没有实践意义的。最为实际的方法是,将部分内容缓存到局域网服务器的大容量磁盘供多个用户共享。   根据因特特网研究集团(Internet Research Group)的 《因特网高速缓存1999年度报告》,预测200…  相似文献   

一种新的基于分区的多媒体代理协作管理策略   总被引:2,自引:0,他引:2  
多媒体代理缓存是提高媒体流化质量和减轻网络负载的重要手段,将基于协作的多媒体代理缓存技术引入无线网络,提出一种新的分区缓存管理模型(Partition-based caching manager,PBCM),通过对系统中各个代理的部分缓存空间(称为静态分区)采取集中式管理,可以合理配置缓存资源,降低缓存的冗余度,从全局角度优化系统的整体性能,具体地,PBCM中制定了一种全局对象放置策略来管理静态分区缓存的内容,该策略被模型化为一个优化问题,并采用改进遗传算法来求解,仿真实验表明该模型及算法是有效可行的。  相似文献   

位置感知查询(LAQ)是移动系统中常用的一种查询方式。提出了一种位置感知查询中的协作缓存管理技术(CoMA-LA),该方法包括三方面的内容:(1)缓存中语义相近数据项的合并;(2)相邻缓存间的协作替换策略;(3)缓存间的数据一致性保证。通过仿真实验将CoMA-LA和传统的LRU算法以及一些已有的缓存替换方法进行了比较,实验结果表明采用CoMA-LA技术能够有效提高缓存利用率,从而降低平均访问时间,提高查询命中率。  相似文献   

针对目前缓存很大程度上只能由程序员根据经验没置,分析了.Net的缓存调度的机制并利用Web日志挖掘技术,提出了“缓存性价比”概念,并据此设计实现了一种自适应的缓存调度优化算法,即SCCOA(self-adaptive cache schedule optimization algorithm)。该算法综合考虑了生成时间、占用空间、并发请求和局部、全局最优情况,能自适应地决定缓存调度,极大地提高Web站点整体性能。  相似文献   

提出一个新的 Web Caching结构模型—基于内容的 Web Caching.模型综合考虑了 Proxy的操作信息和 Web文档的内容特性 ,界定了虚拟用户团体和 Proxy个性 ,并利用 Ontology技术来刻画 Proxy的个性 ,模拟实验表明 ,结合内容属性可以使得 Web Caching性能得到进一步提高  相似文献   

Web 信息检索是指从大量Web 文档集合中找到与给定的查询请求相关的、恰当数目的文档子集。为了更准确地找到相似文档,借助于两个页面的单词覆盖程度,提出一种改进的Web 页面检索度量方法,并在KNN分类实验中得到验证。  相似文献   

王志华  金燕  李占波 《计算机工程》2011,37(11):83-85,88
基于内容的语义Web检索只考虑内容本身,没有考虑用户的不同,不能准确反映用户需求。为此,提出一个自适应语义Web检索框架,对于Web中文文档,借助HowNet知识库给出一种本体学习方法,通过提取用户客观、显式和隐式信息建立用户信息库,并设计用户初始查询本体和个性化查询本体构建算法,从而实现用户的自适应检索。实验结果表明,该方法具有较高的检索效率。  相似文献   

Web主题检索是信息检索领域一个将采集技术与过滤方法结合的新兴方向,也是信息处理领域的研究热点。针对现有主题检索系统在Web页面文本的主题相关性判断和Spider搜索策略方面存在的问题,引入两个性能优化方案,即利用信息抽取技术,提出了一种基于模式集的主题相关性判断方法来提高主题判断准确度;针对pagerank在主题检索中存在的不足,引入基于增强学习的页面评估算法,提出了Web环境优先的搜索策略。最后根据实验结果评估两个算法的性能。  相似文献   

基于用户日志的查询扩展统计模型   总被引:24,自引:0,他引:24       下载免费PDF全文
崔航  文继荣  李敏强 《软件学报》2003,14(9):1593-1599
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.  相似文献   

With the ever-increasing growth of the World Wide Web, there is an urgent need for an efficient information retrieval system that can search and retrieve handwritten documents when presented with user queries. However, unconstrained handwriting recognition remains a challenging task with inadequate performance thus proving to be a major hurdle in providing robust search experience in handwritten documents. In this paper, we describe our recent research with focus on information retrieval from noisy text derived from imperfect handwriting recognizers. First, we describe a novel term frequency estimation technique incorporating the word segmentation information inside the retrieval framework to improve the overall system performance. Second, we outline a taxonomy of different techniques used for addressing the noisy text retrieval task. The first method uses a novel bootstrapping mechanism to refine the OCR’ed text and uses the cleaned text for retrieval. The second method uses the uncorrected or raw OCR’ed text but modifies the standard vector space model for handling noisy text issues. The third method employs robust image features to index the documents instead of using noisy OCR’ed text. We describe these techniques in detail and also discuss their performance measures using standard IR evaluation metrics.  相似文献   

《Computer Networks》2007,51(13):3673-3692
Network congestion remains one of the main barriers to the continuing success of the Internet. For Web users, congestion manifests itself in unacceptably long response times. One possible remedy to the latency problem is to use caching at the client, at the proxy server, or within the Internet. However, Web documents are becoming increasingly dynamic (i.e., have short lifetimes), which limits the potential benefit of caching. The performance of a Web caching system can be dramatically increased by integrating document prefetching (a.k.a. “proactive caching”) into its design. Although prefetching reduces the response time of a requested document, it also increases the network load, as some documents will be unnecessarily prefetched (due to the imprecision in the prediction algorithm). In this study, we analyze the confluence of the two effects through a tractable mathematical model that enables us to establish the conditions under which prefetching reduces the average response time of a requested document. The model accommodates both passive client and proxy caching along with prefetching. Our analysis is used to dynamically compute the “optimal” number of documents to prefetch in the subsequent client’s idle (think) period. In general, this optimal number is determined through a simple numerical procedure. Closed-form expressions for this optimal number are obtained for special yet important cases. We discuss how our analytical results can be used to optimally adapt the parameters of an actual prefetching system. Simulations are used to validate our analysis and study the interactions among various system parameters.  相似文献   

Building a large and efficient hybrid peer-to-peer Internet caching system   总被引:2,自引:0,他引:2  
Proxy hit ratios tend to decrease as the demand and supply of Web contents are becoming more diverse. By case studies, we quantitatively confirm this trend and observe significant document duplications among a proxy and its client browsers' caches. One reason behind this trend is that the client/server Web caching model does not support direct resource sharing among clients, causing the Web contents and the network bandwidths among clients to be relatively underutilized. To address these limits and improve Web caching performance, we have extensively enhanced and deployed our browsers-aware framework, a peer-to-peer Web caching management scheme. We make the browsers and their proxy share the contents to exploit the neglected but rich data locality in browsers and reduce document duplications among the proxy and browsers' caches to effectively utilize the Web contents and network bandwidth among clients. The objective of our scheme is to improve the scalability of proxy-based caching both in the number of connected clients and in the diversity of Web documents. We show that building such a caching system with considerations of sharing contents among clients, minimizing document duplications, and achieving data integrity and communication anonymity is not only feasible but also highly effective.  相似文献   

查询扩展是信息检索中优化查询的一种有效方法。在分析几种基于互信息的查询扩展方法的基础上,将检索词在文档空间中的距离引入到互信息计算中,提出基于向量距离的改进互信息的查询扩展方法。实验结果表明,该方法能够有效提高信息检索中的查询效果。  相似文献   

基于Ontology的信息检索技术研究   总被引:26,自引:0,他引:26  
随着Web 的迅速发展,网上信息资源越来越丰富,网络已经成为了一个全球最大的信息库。而用户要从中得到所需的信息一般是通过各种信息检索工具。但是现有的信息检索工具都存在着检索精度不高等问题。本文针对这些问题,提出了将Ontology 融合到信息检索技术中的思路。利用Ontology 中拥有的领域知识,可以大大提高检索系统对自然语言文本的理解能力,同时方便用户以自然语言的方式提出检索请求,从而提高检索的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号