首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 71 毫秒
1.
随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进后的排序算法能够较好地提高信息检索的准确度,为用户带来了优于Lucene自身排序的搜索体验。  相似文献   

2.
为了在大量网络Web页面中快速找到用户关心的内容,提出使用词汇之间的"相关度"来存储用户的个性化信息,应用能够在用户进行检索的过程中自动建立针对该用户的"词汇相关度"的算法设计了一个个性化元搜索引擎,并通过使用3种不同的利用词汇相关度对底层搜索引擎所返回的结果进行评估和个性化排序的算法进行实验.这里设计的个性化算法的灵敏度、抗干扰性、语义相关性分析3个指标的实验结果说明该算法最终会影响到网页的排序.基于统计方法的词汇相关度模型是一种有效的个性化信息检索技术,它可以大大提高搜索结果的质量.  相似文献   

3.
网络信息检索个性化服务的研究与设计   总被引:1,自引:0,他引:1  
针对目前网络信息检索个性化服务不够周全的缺点,提出并实现了一个提高服务质量的信息检索个性化服务模型。该模型主要通过用户兴趣模型的建立、多维权值排序算法MWRA的优化、自由方式推送用户信息模型的建立三大模块来实现。最后给出传统信息检索模式与新模式的实验结果。  相似文献   

4.
个性化信息服务越来越成为信息检索领域中研究的热点。针对用户模型的构造问题,文章利用用户浏览过的网页历史记录自动进行文本结构分析,获取网页信息的逻辑表示,将段落作为识别用户兴趣的基本要素,利用段落间的聚类分析和对用户兴趣的表达能力,获取最终的用户兴趣特征向量。提出了一种基于主题描述的二级层次用户模型,并给出了用户模型的动态调整算法,构建了一个基于模糊隶属度的个性化网页推荐系统。模拟实验表明,该用户模型和个性化推荐算法能够有效地提高检索结果的准确性,并且具有良好的适应性。  相似文献   

5.
随着Web信息的快速增长和人们对信息检索质量要求的提高,传统的搜索引擎已不能很好地满足人们的需求. 本文提出了一种个性化元搜索引擎模型.个性化是指模型可以针对不同的用户建立不同的用户兴趣模型,然后根据用户兴趣,模型对搜索结果进行过滤、重排序处理,使得显示给用户的搜索结果更具有针对性.本文阐述了各主要功能模块工作原理,并详细介绍了根据用户兴趣模型对搜索结果进行排序的算法,实验表明该算法能够有效地提高用户的检索质量.  相似文献   

6.
随着Internet的广泛应用,越来越多的信息以电子化方式存放在网上,但是信息获取手段的提高并没有满足信息增长的需要,导致了“信息过载”和“资源迷向”现象。虽然有许多信息检索和过滤工具被开发出来,然而,传统的搜索引擎信息服务系统没有有效的手段理解用户准确的信息需求,缺乏智能和个性。针对利用现有的搜索引擎进行信息检索的过程中存在的查准率低和用户无法跟踪网页信息变化的缺点,提出面向用户的个性化信息检索服务理念,在客户端建立基于关键词表的用户个性化信息检索模型。通过用户个性化信息检索模型内部各功能模块之间的通信协作达到面向用户的个性化主动信息检索服务。  相似文献   

7.
基于网页链接与用户反馈的PageRank算法改进研究   总被引:1,自引:0,他引:1  
曹姗姗  王冲 《计算机科学》2014,41(12):179-182
在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角度共同对网页PR值进行合理分配,以在一定程度上达到高质量网页尽量排序靠前、信息价值低的网页尽量下沉的目的。仿真实验表明,BPR算法在一定程度上改善了排序效果,提升了用户信息检索满意度。  相似文献   

8.
针对传统的采用关键词的信息检索方式在个性化方面的不足,提出了一种根据领域本体的个性化信息检索模型.首先获取用户的特征信息,接着利用用户的特征信息构建基于本体的用户兴趣模型,在检索过程中通过领域本体概念和用户兴趣模型对检索请求进行分析并对其进行扩展,获得符合检索意图的结果,在此基础上按兴趣度大小处理后将最终个性化信息检索结果反馈给用户.通过搭建关于本体的个性化检索原型系统,仿真结果验证了改进模型的有效性.  相似文献   

9.
随着网络技术的发展,互联网中越来越多的资源被应用于信息检索中,大量的研究表明,社会化标注可以用于改善信息检索。现有个性化排序的方法中,用户之间的相似度大多通过其共同使用过的标签集来计算。然而,现实中用户标注数据存在稀疏性和标签同义词等问题,导致相似度计算并不准确。在前人研究的基础上,提出了一种融合主题域相似的个性化排序方法。该方法首先通过主题域的划分,将不同主题含义的网页及标签分开,通过构建的标签相似网络找出标签同义词。然后结合用户标签和主题偏好找出兴趣相近的用户,并对用户的标注信息进行扩展,从而能够有效地改善个性化信息检索的效果。在真实数据上的实验结果表明,该方法能有效缓解标注稀疏性和标签同义词问题,有助于改善用户检索体验。  相似文献   

10.
通用搜索引擎在检索过程中会出现查询结果与关键词所属领域无关的主题漂移现象.本文提出了面向特定领域的网页重排序算法-TSRR(Topic Sensitive Re-Ranking)算法,从一个新的视角对主题漂移问题加以解决. TSRR算法设计一种独立于网页排序的模型,用来表示领域,然后建立网页信息模型,在用户检索过程中结合领域向量模型和网页信息模型对网页搜索结果进行重排序.在爬取的特定领域的数据集上,以用户满意度和准确率为标准进行评估,实验结果表明,本文中提出的TSRR算法性能优异,比经典的基于Lucene的排序算法在用户满意度上平均提高17.3%,在准确率上平均提高41.9%.  相似文献   

11.
基于高级搜索页面的动态表单搜索   总被引:1,自引:0,他引:1  
根据表毕.项前的文字信息反映表单项输入信息的特点,提出通过解析表单项动态填充表单的方法,解决了应用网站自身高级搜索页面对同一类型的多个网站进行搜索的问题。针对图书类的网站进行研究,利用动态解析表单获得结果页面,对其进行解析并加权排序,最后按照统一的显示格式展现。根据实验结果验证了算法设计的正确性,可利用本算法对多个同类型的网站借助其自身搜索进行搜索查询。  相似文献   

12.
量子搜索算法,相较于经典计算有着平方根的加速,在许多机器学习算法中都有广泛应用,如量子KNN算法、量子特征提取、量子主成分分析等.在目标分量占比较小的时候,量子搜索算法总能以较高的概率得到目标分量;然而,当目标分量占比较大时,量子搜索算法的成功概率急剧下降.为解决这个问题,本文拟提出一种搜索空间自适应的量子搜索算法.新算法依据目标分量占比的不同采用不同的策略:当目标分量占比为λ≥1/2,将搜索空间扩大为8N;当目标分量占比1/4≤λ<1/2时,将搜索空间扩大为4N;当目标分量占比1/8≤λ<1/4时,将搜索空间扩大为2N;当目标分量占比λ<1/8时,保持搜索空间不变.通过理论分析,改进算法整体效率得到显著的改进,能够保持93%以上的成功概率.  相似文献   

13.
搜商     
陈沛 《现代计算机》2008,(6):110-110
随着信息时代的来临,知识更新13新月异,我们穷极一生的学习成果与人类的知识总量相比,犹如沧海一粟。幸运的是,搜索引擎已成为人类获取新知识最有效的手段。  相似文献   

14.
随着网络迅速发展,Internet上的资源日趋丰富,搜索引擎被网民广泛使用,搜索引擎的发展为垂直搜索引擎的出现提供了良好的市场空间,本文介绍了基于垂直搜索技术的搜索引擎,并探讨了垂直搜索引擎的优势.  相似文献   

15.
网上信息搜索技术与搜索引擎   总被引:6,自引:1,他引:6  
随着Internet在全球范围内的迅速兴起,面对纷繁复杂的Web空间,如何在浩翰如海的信息空间里快速找到并取得所需的信息,便成为人们所关注的主要问题。搜索引擎的出现,极大地方便了Internet用户,使快速有效地获取信息成为可能。目前网上搜索引擎各种各样,有Yahoo!、Excite、AltaVista、Lycos、Infoseek、OpenText、WebCrawler、WWW Worm等几十种。  相似文献   

16.
具有邻域搜索机制的爆炸搜索算法   总被引:2,自引:0,他引:2       下载免费PDF全文
曹炬  侯学卿 《计算机工程》2011,37(18):183-184
受烟花(炸弹)爆炸的启发,提出一种新型的智能优化算法——爆炸搜索算法(ESA)。该算法引入邻域搜索的思想,包含3个重要算子:爆炸搜索算子,迁移算子,变异算子,具有较大的局部-全局搜索能力,且收敛速度快、稳定性好。对benchmark函数集进行仿真并与CPSO等算法进行比较,实验结果证实了ESA的高效性。  相似文献   

17.
本文首先介绍了传统搜索引擎的基本原理及结构,指出了传统搜索引擎存在的不足,然后介绍了元搜索引擎的定义、运作机制及其发展的方向,在此理论的基础上提出了新一代元搜索引擎基于用户的调度改进理念,实验表明,该改进提高了用户的检索效率和质量。  相似文献   

18.
Internet上的搜索引擎和元搜索引擎   总被引:18,自引:2,他引:18  
1.引言 Internet自诞生以来不断成长,尤其是最近几年更是得到长足发展,功能不断扩展,信息容量呈爆炸性趋势增长,仅Internet Archive收集的1996年以来的Web内容就达到四十亿个页面,容量达到40TB。据Internet Domain Survey统计,从1996年到2001年,Internet上的主机数量从两千万增长到一亿四千万。Internet作为一个信息平台在人们的生活和工作中发挥越来越重要的作用,人们越来越多地通过In-ternet获取信息。然而在信息极大丰富的同时,用户也面临着信息过载和资源迷向的问题。Internet上的信息过于庞杂,而  相似文献   

19.
机器故障查找是机器维修的一个重要环节,在搜索论的基础上提出了一种机器故障查找模型,利用启发式贪 婪算法求解该模型,并进行了实际数据验证。实验结果表明了利用该模型的  相似文献   

20.
基于双起点十字搜索模型的自适应搜索算法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出一种基于双起点十字搜索模型的自适应搜索算法。该算法采用大小十字搜索模型、八边形搜索模型和斜交叉十字搜索模型,根据不同情况,使用相应的搜索模型,同时采用中值预测及提前跳出策略,减少不必要的搜索。序列测试结果表明,与UMHexagonS算法相比,新算法在保持相当的峰值信噪比和比特率的情况下,运动估计时间平均节省了15.88%和15.94%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号