首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
面向个性化服务的网页特征描述   总被引:1,自引:0,他引:1  
个性化服务研究核心点在于准确描述用户兴趣,即对用户访问过并感兴趣的网页进行准确描述。现今对网页特征描述方法还未有系统的研究。针对网页特征描述中涉及的特征抽取范围,特征词规范化及词语权重计算3方面内容进行了分析研究,将改进后的新方法应用于个性化服务系统时取得了较好的信息推荐效果。  相似文献   

2.
基于WEB个性化服务的主要目的是根据用户访问过并且感兴趣的网页进行准确描述,以满足用户对针对性、可定制性、主动性、智能性服务的要求。本文从网页特征描述中涉及到的个性化词典引入、网页特征词权重改进计算两个方面进行分析研究,提出了新的算法描述。  相似文献   

3.
搜索引擎发展到今天,个性化搜索一直是热门的研究方向之一,而基于用户兴趣库的个性化研究方向是研究基础。针对个性化搜索,结合用户兴趣和用户搜索实时需求提出交互式搜索,专业的垂直搜索和在排序过程中利用截断计算,并提出相应的个性化因子。  相似文献   

4.
个性化元搜索引擎的研究   总被引:1,自引:0,他引:1  
针对现有搜索引擎的局限性和当前用户的个性化需求,以用户兴趣模型为基础,对个性化元搜索引擎的基本原理和结构、方法及关键技术进行了研究,并在此基础上提出了用户个性化元搜索引擎的简单实现。  相似文献   

5.
个性化元搜索引擎模型研究   总被引:3,自引:1,他引:2       下载免费PDF全文
在分析了传统搜索引擎以及现有元搜索引擎不足之后,提出了基于Agent的个性化元搜索引擎模型,与传统的元搜索引擎系统相比改进了系统的运行效率,同时给出了基于用户反馈的个性化QR-加权重排序算法,将检索结果的排序质量以及文档的相关度在重排序中加以考虑,与传统的线性重排序算法相比提高了查询的准确程度。  相似文献   

6.
1 前言随着互联网建设的不断发展,网站和网页数目都已经很难用Lawrence在Science和Nature给出的结论来估算。每个在网上冲浪的人都有体会,迷失在Internet浩瀚的资料中是多么容易。世界上最大的搜索引擎Google已经宣称搜索并索引了2,073,418,204张网页,在这近21亿索引并分类的网页中搜索,用户同样会迷失在层层链接之中。  相似文献   

7.
李晓丽  杜振龙 《计算机工程》2010,36(19):258-260
针对通用搜索技术难以满足不同背景、不同目的和不同时期的用户查询请求的缺陷,提出一种基于Lucence实现用户兴趣驱动的个性化搜索引擎方法。从Cookie文件分析用户搜索兴趣,构造用户兴趣向量,驱动搜索引擎,产生用户关注度高的搜索结果。实验结果表明,该用户兴趣驱动的个性化搜索引擎能够搜索出用户感兴趣的搜索结果,与传统搜索引擎相比,检索准确率有一定的提高。  相似文献   

8.
基于网页特征的TFIDF改进算法   总被引:6,自引:1,他引:6  
本文分析了传统的TFIDF算法。提出了一种改进的TFIDF算法,将提取到的网页特征加入传统的TFIDF算法,从而更为准确地抽取网页中的重要文字。  相似文献   

9.
10.
随着Internet网络的迅猛发展.个性化信息服务越来越成为信息检索领域的研究热点.本文分析了国内外个性化信息服务研究现状.提出了基于综合倒排索引的搜索算法,从关键词、主题词和评语三个角度出发建立综合倒排索引进行全文搜索.模拟实验表明,该算法能有效提高信息检索的查准率.  相似文献   

11.
在虚拟网页技术基础上,借鉴模块化程序设计思想,提出了Web页面模块化设计方法。将虚拟网页技术与模块化相结合,可显著改变信息的组织与存储方式,具有支持模块级的网页设计复用、快速重组、扩展与更新等显著特点。  相似文献   

12.
基于Web日志的个性化搜索引擎模型的发现*   总被引:1,自引:0,他引:1  
鲍钰 《计算机应用研究》2009,26(5):1806-1809
个性化搜索是指同样的关键字对不同的人返回其感兴趣的搜索结果。对于不同的用户个体,同样的关键字可能有不同含义,如关键字“apple”被爱好音乐的人士理解为Apple iPod,但也会被健康饮食的人士理解为apple fruit。每次用户搜索关键字的过程,都会被记录在网站服务器的后台日志中。通过若干挖掘算法,将Web原始日志信息进行用户识别,会话分组后,提取单一用户多次会话中的搜索关键字关联规则,为实现个性化搜索引擎提供参考。  相似文献   

13.
P. Ferragina  A. Gulli 《Software》2008,38(2):189-225
We propose a (meta‐)search engine, called SnakeT (SNippet Aggregation for Knowledge ExtracTion), which queries more than 18 commodity search engines and offers two complementary views on their returned results. One is the classical flat‐ranked list, the other consists of a hierarchical organization of these results into folders created on‐the‐fly at query time and labeled with intelligible sentences that capture the themes of the results contained in them. Users can browse this hierarchy with various goals: knowledge extraction, query refinement and personalization of search results. In this novel form of personalization, the user is requested to interact with the hierarchy by selecting the folders whose labels (themes) best fit her query needs. SnakeT then personalizes on‐the‐fly the original ranked list by filtering out those results that do not belong to the selected folders. Consequently, this form of personalization is carried out by the users themselves and thus results fully adaptive, privacy preserving, scalable and non‐intrusive for the underlying search engines. We have extensively tested SnakeT and compared it against the best available Web‐snippet clustering engines. SnakeT is efficient and effective, and shows that a mutual reinforcement relationship between ranking and Web‐snippet clustering does exist. In fact, the better the ranking of the underlying search engines, the more relevant the results from which SnakeT distills the hierarchy of labeled folders, and hence the more useful this hierarchy is to the user. Vice versa, the more intelligible the folder hierarchy, the more effective the personalization offered by SnakeT on the ranking of the query results. Copyright © 2007 John Wiley & Sons, Ltd.  相似文献   

14.
用户特征的描述方式是实现个性化搜索算法的核心因素。针对传统的基于关键词向量空间模型的用户特征描述过于简单,不能全面描述用户兴趣的缺陷,将folksonomy的结构与本体概念的清晰语义相结合,提出一种多层用户特征描述方式。从用户兴趣主题、用户间关联两个不同角度,从用户生成的标签、标记的文档及主题等不同层次建立用户特征描述模型,并将其应用于个性化搜索过程的方式进行分析。同时对个性化搜索的结果评价方式、资源类型对用户特征及搜索结果的影响进行了讨论。在Delicious和Flickr两种不同类型数据集上的实验表明,所提出用户特征模型能够有效提高个性化搜索结果的性能。  相似文献   

15.
对搜索引擎个性化服务技术中的用户描述文档、资源描述文档、个性化推荐技术、个性化服务体系结构以及该领域的主要研究成果进行了综述.通过比较现有原型系统的实现方式,详细讨论了实现个性化服务的关键技术.  相似文献   

16.
个性化搜索引擎系统机制的研究   总被引:2,自引:0,他引:2  
随着网络信息资源的迅速增加,个性化信息服务越来越成为信息检索领域中研究的热点,针对传统搜索引擎系统的缺点,提出了一种新型个性化搜索引擎系统的体系结构,并在此基础上给出了系统中个性化机制的相关算法,同时使用基于关键词的搜索,利用Web挖掘技术,在实现为不同用户提供不同检索结果的同时提高了个性化查询的精确度和速度,保证了全查率.  相似文献   

17.
导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。 为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区域;然后,依据人类视觉特点,对各区域进行视觉“奇异性”量化,同时利用奇异性传递规则进一步强化关键词相关区域的视觉“奇异性”。P-KEA根据PIX-PAGE模型模型的视觉量化结果,能够较准确地找到视觉突出区域中的关键词。实验结果表明,与基于DocView模型的算法DVM相比,P-KEA的准确率平均提高了20.9%。  相似文献   

18.
针对中文新闻网页的特点,使用了包括统计特征、位置特征和词性特征等在内的多种特征综合评定候选关键词的权重大小。对于部分分词结果不能良好地反映主题的问题,提出了一种基于有向图的组合词生成方法,旨在找出高频次的相邻词作为组合词。实验结果表明,该方法较传统的TF-IDF方法效率有较大提升,能够有效提取出新闻网页关键词。  相似文献   

19.
基于中文搜索引擎网络信息用户行为研究*   总被引:1,自引:0,他引:1  
为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行为的一些规律等。研究结果表明,对准确地评测搜索引擎检索的效果以及未来中文搜索引擎设计的改进都有较好的指导意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号