首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
陈海燕  徐峥  张辉 《计算机科学》2016,43(2):277-282
搜索引擎的一个标准是不同的用户用相同的查询条件检索时,返回的结果相同。为解决准确性问题,个性化搜索引擎被提出,它可以根据用户的不同个性化特征提供不同的搜索结果。然而,现有的方法更注重用户的长时记忆和独立的用户日志文件,从而降低了个性化搜索的有效性。获取用户短时记忆模型来提供准确有效的用户偏好的个性化搜索方法被广泛采用。首先,根据基于查询关键词的相关概念生成短期记忆模型;接着,基于用户的时序有效点击数据生成用户个性化模型;最后,在用户会话中引入了遗忘因子来优化用户个性化模型。实验结果表明,所提出的方法可以较好地表达用户信息需求,较为准确地构建用户的个性化模型。  相似文献   

2.
当前基于关键字查询的大多数搜索引擎都没有提供个性化的用户服务,搜索结果主要根据关键字与文档的相似度来排序,这很难满足用户对日益膨胀的信息资源的需求。面对用户越来越难以迅速精确地检索到所需信息的现状,本文提出一种应用于LAN中的基于概念的三层搜索引擎模型:通过用户交互的方式,使得搜索具有个性化、智能化的特点。  相似文献   

3.
方刚 《计算机系统应用》2010,19(12):100-104
针对Web服务器日志中会话模式的页面属性为布尔量的特点,提出一种基于序列数的Web使用挖掘算法。该算法将用户会话模式转换成二进制数,然后用数字递增方式搜索候选频繁项;算法通过序列数的维来计算支持数,实现一次扫描用户会话模式,有效地提高了Web使用挖掘的效率。实验表明其效率比现有算法更快速而有效。  相似文献   

4.
互联网用户使用网络获取信息过程中,搜索引擎已成为必不可少的工具。传统的WWW搜索引擎是“提问——搜索”方式.对于所有用户给出同样的关键宇得到的检索结果都是一样的。本文基于传统搜索引擎Google的基础上,实现了个性化的搜索。论文重点阐述了基于向量空间模型的个性化搜索系统的设计和实现过程。系统返回结果能够根据不同用户的兴趣爱好给出用户满意度较好的结果。  相似文献   

5.
XML关键字搜索是一个用户友好的信息发现方法,非常适用于XML文档不存在schema的情况,但问题是用户在关键字搜索中很难准确地表达搜索语义.现有的主要XML关键字搜索的研究是基于SLCA(最小最低公共祖先)方法,但该方法可能会丢失一部分有意义的结果.提出一种新的基于语义距离的模型,更全面地考虑XML文档结构的语义特性;在该模型的基础上,设计了多种算法将彼此语义相近的关键字结点聚集在一起形成XML关键字搜索结果,并用大量实验对几种算法进行了比较.  相似文献   

6.
可搜索加密技术可在不解密数据密文的同时实现密文关键字的检索,很好地保护了数据存储方的隐私。针对目前大多数可搜索加密方案无法支持用户自定义搜索策略的问题,提出了一种安全、高效、可支持任意表达的基于属性可搜索加密方案。该方案首先基于LSSS搜索结构,支持任意合取、析取或单调布尔表达式的多关键字搜索策略,用户使用私钥为LSSS搜索策略生成陷门,云服务器通过陷门可以搜索包含满足特定关键字搜索策略的密文;其次,通过与基于属性加密方案结合,可以实现对云中加密数据的细粒度访问控制;另外,该方案通过将关键字拆分成关键字名和关键字值以及“线性拆分”技术,使得攻击者无法从密文和陷门中推测出关键字值敏感信息;最后,通过将部分解密工作转移到云服务器来降低用户的计算负担。基于DBDH、(q-2)和判定线性假设证明了所提方案的安全性,理论分析和实验结果也表明了该方案的有效性。  相似文献   

7.
公钥加密关键字搜索(PEKS)允许用户发送关键字陷门给服务器,服务器可以通过陷门定位到包含用户搜索的关键字的密文。为了消除已有基于身份加密的关键字搜索(IBEKS)方案中服务器和接收者之间的安全信道,Wu等人提出了一种指定服务器基于身份加密的关键字搜索(dIBEKS)方案。可是,Wu等人提出的dIBEKS方案不满足密文不可区分性。为了克服Wu等人方案的不足,本文提出一种指定服务器基于身份加密的多关键字搜索方案。安全性分析表明,本文所提方案同时满足了密文不可区分、陷门不可区分和离线关键字猜测攻击的安全性。效率分析显示,本文的方案更高效。   相似文献   

8.
黄宏涛 《福建电脑》2014,(11):181-182
会话识别是Web日志挖掘过程的重要步骤。针对目前的几种会话识别方法,提出了一种基于页面下载时间、页面内容和页面重要性等多个参数,针对不同用户的个性化识别方法,提高了会话识别的准确性。  相似文献   

9.
蒋小春 《电脑迷》2012,(7):19-19
随着百度、谷歌等搜索引擎的功能愈发智能化,用户在网上搜索内容时只需敲入模糊的关键字就能找到相应的答案了。不过,用户在使用常用软件的内置搜索功能时,如果只通过默认的关键字搜索,就不太容易找到自己满意的答案,只有熟悉软件搜索功能的高级模式,才能让软件变得更顺手。  相似文献   

10.
P2P节点用户的搜索内容在一定程度上体现了用户的兴趣.为此,提出一种基于关键字关联和节点兴趣的P2P信息搜索机制.该机制注重关键字之间关系的学习,通过用户操作发现节点兴趣.在搜索中利用关键字的语义关系增加命中目标,提高搜索成功率.根据节点兴趣缩小搜索范围、降低搜索开销.实验结果表明,采用快速建立索引表的方法和反馈机制能...  相似文献   

11.
传统搜索引擎是基于关键字的检索,然而文档的关键字未必和文档有关,而相关的文档也未必显式地包含此关键字。基于语义Web的搜索引擎利用本体技术,可以很好地对关键字进行语义描述。当收到用户提交的搜索请求时,先在已经建立好的本体库的基础上对该请求进行概念推理,然后将推理结果提交给传统的搜索引擎,最终将搜索结果返回给用户。相对于传统的搜索引擎,基于语义Web的搜索引擎有效地提高了搜索的查全率和查准率。  相似文献   

12.
吴启明 《计算机工程》2010,36(13):84-86
为得到更好的Web社区划分,运用LSI方法,对Web页面的内容和结构信息分别进行基于潜在语义的社区挖掘,并对产生的社区进行集成。实验结果表明,Web双视图集成算法能够加强语义,使较小的社区划分被弱化,与单一的基于结构链接或内容的社区挖掘算法相比,具有更高的准确性。在信息检索的应用中发现,运用该算法检索特指性不强的关键词时,搜索效果有较明显改善。  相似文献   

13.
时雷  席磊  段其国 《计算机科学》2007,34(10):228-229
本文提出了一种基于粗糙集理论的个性化web搜索系统。用户偏好文件中对关键字进行分组以表示用户兴趣类别。利用粗糙集理论处理自然语言的内在含糊性,根据用户偏好文件对查询条件进行扩展。搜索组件使用扩展后的查询条件搜索相关信息。为了进一步排除不相关信息,排序组件计算查询条件和搜索结果之间的相似程度,根据计算值对搜索结果进行排序。与传统搜索引擎进行了比较,实验结果表明,该系统有效地提高了搜索结果的精度,满足了用户的个性化需求。  相似文献   

14.
基于关键词相关度的Deep Web爬虫爬行策略   总被引:1,自引:0,他引:1       下载免费PDF全文
田野  丁岳伟 《计算机工程》2008,34(15):220-222
Deep Web蕴藏丰富的、高质量的信息资源,为了获取某Deep Web站点的页面,用户不得不键入一系列的关键词集。由于没有直接指向Deep Web页面的静态链接,目前大多数搜索引擎不能发现这些页面。该文提出的Deep Web爬虫爬行策略,可以有效地下载Deep Web页面。由于该页面只提供一个查询接口,因此Deep Web爬虫设计面对的主要挑战是怎样选择最佳的查询关键词产生有意义的查询。实验证明文中提出的一种基于不同关键词相关度权重的选择方法是有效的。  相似文献   

15.
Internet的迅猛发展,使其日益成为人们查找有用数据的重要来源。一般的搜索引擎是基于关键字的查询,命中率较低,且不能针对特定用户给出特定服务。提出了将自然语言理解技术与Web数据挖掘相结合,根据用户的特殊需求定制个性化的Web数据挖掘系统,给出了面向新闻挖掘这一特定领域的Web挖掘系统News-Miner的应用方案及设计实现。初步实验结果表明该方案是可行的。该方法可方便地扩展到其它专业应用领域。  相似文献   

16.
The Web as a global information space is developing from a Web of documents to a Web of data. This development opens new ways for addressing complex information needs. Search is no longer limited to matching keywords against documents, but instead complex information needs can be expressed in a structured way, with precise answers as results. In this paper, we present Hermes, an infrastructure for data Web search that addresses a number of challenges involved in realizing search on the data Web. To provide an end-user oriented interface, we support expressive user information needs by translating keywords into structured queries. We integrate heterogeneous Web data sources with automatically computed mappings. Schema-level mappings are exploited in constructing structured queries against the integrated schema. These structured queries are decomposed into queries against the local Web data sources, which are then processed in a distributed way. Finally, heterogeneous result sets are combined using an algorithm called map join, making use of data-level mappings. In evaluation experiments with real life data sets from the data Web, we show the practicability and scalability of the Hermes infrastructure.  相似文献   

17.
Given a user keyword query, current Web search engines return a list of individual Web pages ranked by their "goodness" with respect to the query. Thus, the basic unit for search and retrieval is an individual page, even though information on a topic is often spread across multiple pages. This degrades the quality of search results, especially for long or uncorrelated (multitopic) queries (in which individual keywords rarely occur together in the same document), where a single page is unlikely to satisfy the user's information need. We propose a technique that, given a keyword query, on the fly generates new pages, called composed pages, which contain all query keywords. The composed pages are generated by extracting and stitching together relevant pieces from hyperlinked Web pages and retaining links to the original Web pages. To rank the composed pages, we consider both the hyperlink structure of the original pages and the associations between the keywords within each page. Furthermore, we present and experimentally evaluate heuristic algorithms to efficiently generate the top composed pages. The quality of our method is compared to current approaches by using user surveys. Finally, we also show how our techniques can be used to perform query-specific summarization of Web pages.  相似文献   

18.
Mukherjea  Sougata  Hirata  Kyoji  Hara  Yoshinori 《World Wide Web》1999,2(3):115-132
Search engines are useful because they allow the user to find information of interest from the World Wide Web. However, most of the popular search engines today are textual; they do not allow the user to find images from the Web. This paper describes AMORE, a Web search engine that allows the user to retrieve images from the Web by specifying relevant keywords or a similar image. Text and image search can also be combined. Moreover, we have developed a Query Result Visualization Environment that allows the organization of the results if many images are retrieved. In this paper we present AMORE's user interface and explain the technique for retrieving images visually similar to a user specified image. The method of automatically assigning relevant keywords to the images is then explained. Finally, the architecture of the system as well as some interesting observations of our experiences with AMORE are discussed. This revised version was published online in August 2006 with corrections to the Cover Date.  相似文献   

19.
Keyword queries have long been popular to search engines and to the information retrieval community and have recently gained momentum for its usage in the expert systems community. The conventional semantics for processing a user query is to find a set of top-k web pages such that each page contains all user keywords. Recently, this semantics has been extended to find a set of cohesively interconnected pages, each of which contains one of the query keywords scattered across these pages. The keyword query having the extended semantics (i.e., more than a list of keywords hyperlinked with each other) is referred to the graph query. In case of the graph query, all the query keywords may not be present on a single Web page. Thus, a set of Web pages with the corresponding hyperlinks need to be presented as the search result. The existing search systems reveal serious performance problem due to their failure to integrate information from multiple connected resources so that an efficient algorithm for keyword query over graph-structured data is proposed. It integrates information from multiple connected nodes of the graph and generates result trees with the occurrence of all the query keywords. We also investigate a ranking measure called graph ranking score (GRS) to evaluate the relevant graph results so that the score can generate a scalar value for keywords as well as for the topology.  相似文献   

20.
基于Hive的海量搜索日志分析系统研究   总被引:2,自引:0,他引:2  
赵龙  江荣安 《计算机应用研究》2013,30(11):3343-3345
针对传统分布式模型在海量日志并行处理时的可扩展性和并行程序编写困难的问题, 提出了基于Hive的Web海量搜索日志分析机制。利用HQL语言以及Hadoop分布式文件系统(HDFS)和MapReduce编程模式对海量搜索日志进行分析处理, 对用户搜索行为进行了分析研究。对用户搜索行为中的查询热点主题、用户点击数和URL排名、查询会话的分析结果对于搜索引擎的排序算法和系统优化都有一定的指导意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号