共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
3.
基于Web日志的个性化搜索引擎模型的发现* 总被引:1,自引:0,他引:1
个性化搜索是指同样的关键字对不同的人返回其感兴趣的搜索结果。对于不同的用户个体,同样的关键字可能有不同含义,如关键字“apple”被爱好音乐的人士理解为Apple iPod,但也会被健康饮食的人士理解为apple fruit。每次用户搜索关键字的过程,都会被记录在网站服务器的后台日志中。通过若干挖掘算法,将Web原始日志信息进行用户识别,会话分组后,提取单一用户多次会话中的搜索关键字关联规则,为实现个性化搜索引擎提供参考。 相似文献
4.
5.
传统搜索引擎是基于关键字的检索,然而文档的关键字未必和文档有关,而相关的文档也未必显式地包含此关键字。基于语义Web的搜索引擎利用本体技术,可以很好地对关键字进行语义描述。当收到用户提交的搜索请求时,先在已经建立好的本体库的基础上对该请求进行概念推理,然后将推理结果提交给传统的搜索引擎,最终将搜索结果返回给用户。相对于传统的搜索引擎,基于语义Web的搜索引擎有效地提高了搜索的查全率和查准率。 相似文献
6.
7.
基于聚类算法的个性化搜索研究 总被引:1,自引:0,他引:1
搜索引擎的出现使得用户从信息爆炸性增长的互联网上获取所需的信息成为可能,个性化搜索引擎的研究使搜索结果尽可能满足不同用户的信息需求。文中提出了一种基于改进的DBSCAN算法的个性化搜索方法,在全文搜索包lucene与开源搜索引擎Nutch的基础上,实验证明该方法改善了聚类的结果,提高了用户搜索的准确率。 相似文献
8.
9.
10.
你是否想过创建一个搜索自己感兴趣内容的搜索引擎,并在自己指定的网站中进行搜索?现在Windows Live搜索引擎提供了一项搜索宏功能,可以让用户自由创建自己的个性化Windows Live搜索引擎,以指定的关键字搜索特定的网站。不管网站属不属于你,都可以用来搜索。下面就随笔者一起来 相似文献
11.
个人数字信息检索技术随着搜索技术的发展而蓬勃兴起,满足了人们对存储在个人电脑中的数据信息的检索需要。讨论了个人信息检索技术的历史、现状,比较了现有的桌面搜索产品,总结了个人信息技术面对的主要问题。在参考其他个人信息检索研究的基础上,针对未开放格式文件的检索问题,提出了个人信息检索模型的改进。 相似文献
12.
基于Lucene的搜索引擎设计与实现 总被引:14,自引:0,他引:14
当今搜索引擎已经成为人们在网上搜索信息的重要工具。通用的搜索引擎虽然功能强大,但对具有很多子网站的企业门户网站进行搜索时响应速度慢,索引范围不全。Lucene是一个强大的全文索引引擎工具包,应用它可以快速地开发一个搜索引擎。文中描述了利用基于Java的全文检索工具包Lucene开发定制的中文搜索引擎方法,并且将该定制的搜索引擎与Google的站内搜索进行试验比较,发现在对具有很多子网站的企业门户网站进行搜索时有优于Google的性能。 相似文献
13.
基于用户行为分析的个人信息检索研究 总被引:1,自引:0,他引:1
个人信息检索是指个人计算机上用户搜索个人信息(通常是文档)的过程,与互联网检索相比,个人信息检索能够利用的信息很少,这使得其检索结果的排序更加困难。该文通过考察计算机上的用户行为,对个人信息检索的排序问题进行深入的研究。该文考察的用户行为主要包括用户在检索系统中的查询行为和在计算机上的文件访问行为。该文一方面通过查询行为数据训练出结果排序函数,另一方面通过文件访问行为数据获取文件自身的权重,最后利用统计学习方法结合这两类行为的计算结果。实验结果表明,该文提出的方法好于传统的TFIDF排序方法。 相似文献
14.
随着Web Services技术的不断成熟和发展,存储在UDDI Registry中的Web Service信息将会变得越来越庞大,如何从UDDI Registry浩如烟海的信息资源中为用户快速、方便、准确地检索出满足需求的Web Service,将变得十分重要.而传统的基于关键词匹配的检索技术已不能满足用户准确而全面定位信息的要求.因此,以Web Service的文本描述信息为研究对象,运用文本挖掘相关方法,构建出用户概念空间,对用户提出的查询要求进行概念检索.着重介绍了用户概念空间的构建方法以及概念检索的匹配运算过程,并给出了应用于UDDI Registry的一种智能检索引擎系统模型. 相似文献
15.
化学主题网络爬虫的设计和实现 总被引:1,自引:0,他引:1
由于通用搜索引擎检索返回的结果过多、主题相关性不强以及随着人们对提供的各项信息服务的要求越来越高,基于整个Web的信息采集越来越力不从心。同时它无法及时地采集到足够的最新的Web信息,也不能满足人们日益增长的个性化需求。本文通过把Internet化学资源导航系统所积累的化学知识与搜索引擎的自动采集技术相结合展开了对化学主题网络爬虫开发的研究。结果表明,基于Widrow-Hoff分类器的化学主题网络爬虫能有效的采集化学相关的网页。 相似文献
16.
随着Web信息的快速增长和人们对信息检索质量要求的提高,传统的搜索引擎已不能很好地满足人们的需求. 本文提出了一种个性化元搜索引擎模型.个性化是指模型可以针对不同的用户建立不同的用户兴趣模型,然后根据用户兴趣,模型对搜索结果进行过滤、重排序处理,使得显示给用户的搜索结果更具有针对性.本文阐述了各主要功能模块工作原理,并详细介绍了根据用户兴趣模型对搜索结果进行排序的算法,实验表明该算法能够有效地提高用户的检索质量. 相似文献
17.
信息服务个性化过程中的精确信息匹配算法 总被引:2,自引:0,他引:2
随着信息数量和信息资源的持续增长,目前越来越需要个性化信息服务系统来为信息的需求者提供个性化的信息服务。而实现个性化的信息服务需要一种精确的信息匹配算法。该文提出了基于奇异值分解的个性化信息匹配算法,可以利用用户的特征信息完成个性化的信息匹配。该算法实现简单,可以应用到目前的一些信息服务系统中,如搜索引擎等。 相似文献
18.
Scalable search-based image annotation 总被引:4,自引:0,他引:4
With the popularity of digital cameras, more and more people have accumulated considerable digital images on their personal
devices. As a result, there are increasing needs to effectively search these personal images. Automatic image annotation may
serve the goal, for the annotated keywords could facilitate the search processes. Although many image annotation methods have
been proposed in recent years, their effectiveness on arbitrary personal images is constrained by their limited scalability,
i.e. limited lexicon of small-scale training set. To be scalable, we propose a search-based image annotation algorithm that
is analogous to information retrieval. First, content-based image retrieval technology is used to retrieve a set of visually
similar images from a large-scale Web image set. Second, a text-based keyword search technique is used to obtain a ranked
list of candidate annotations for each retrieved image. Third, a fusion algorithm is used to combine the ranked lists into
a final candidate annotation list. Finally, the candidate annotations are re-ranked using Random Walk with Restarts and only
the top ones are reserved as the final annotations. The application of both efficient search techniques and Web-scale image
set guarantees the scalability of the proposed algorithm. Moreover, we provide an annotation rejection scheme to point out
the images that our annotation system cannot handle well. Experimental results on U. Washington dataset show not only the
effectiveness and efficiency of the proposed algorithm but also the advantage of image retrieval using annotation results
over that using visual features. 相似文献
19.