首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 561 毫秒
1.
胡博  蒋宗礼 《计算机科学》2016,43(9):247-249, 273
文档检索结果的排序和文本分类技术是解决垂直搜索、个性化信息检索、信息过滤等相关问题的核心技术。为了提高检索系统的性能,针对Lucene的基础排序算法,提出了一种融合位置相关和概率排序的改进方法。考虑到查询词在文档中出现的位置信息和概率排序对文档相关性的影响,利用位置相关的查询词权值和基于朴素贝叶斯分类算法的文档相关性概率值,对Lucene基础排序算法的评分公式进行改进。实验表明,该改进方法能够有效提高垂直搜索的准确率,使用户拥有更好的垂直搜索体验。  相似文献   

2.
针对企业搜索引擎提出一种基于本地文档库的个性化表示与结果排序算法,以帮助用户找到真正感兴趣的结果.首先,采用聚类分析对用户浏览的历史文档聚类;其次,采用模糊推理技术对所形成的分类进行分析,发现用户对各分类的喜好程度;再次,按用户对各分类喜好程度的不同,为各分类分配抽样文档数;最后,采用多种抽样技术,从各分类中抽取典型文档.来自不同分类的典型文档构成了表示用户个性的本地文档库.结果排序算法通过计算通用企业搜索引擎的搜索结果与本地文档库中各文档的相似性,对结果集重新排序,从而体现出用户个性.实验结果表明,与传统的基于关键词的个性化表示与结果排序算法相比,基于本地文档集的个性化表示与结果排序算法可以给出更能反映用户个性的查询结果,且可以对用户偏好的变化作出更迅速的反映.  相似文献   

3.
基于聚类和用户兴趣分析结合的个性化元搜索   总被引:1,自引:1,他引:0  
随着Web信息的快速增长,搜索引擎已成为用户信息检索的主要工具。元搜索引擎综合了多个搜索引擎的搜索结果,提高了搜索的覆盖率,但是返回的结果往往数目庞大,并且很多结果与用户查询并不相关,这直接影响了用户检索的质量并增加了用户检索的代价。本文提出一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立兴趣模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,与用户模型聚类相结合返回给用户个性化的搜索结果。  相似文献   

4.
搜索引擎中的聚类浏览技术   总被引:1,自引:0,他引:1  
搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,方便地找到感兴趣的信息。本文介绍了搜索引擎的聚类浏览技术对聚类算法的基本要求及其分类方法,研究分析了主要聚类算法及其改进方法的特点,讨论了对聚类质量的评价,最后指出了聚类浏览技术的发展趋势。  相似文献   

5.
介绍了一个基于专业搜索引擎的元搜索引擎,提出了一种将专业搜索引擎与专门搜索"Invisible Web"检索工具相结合的方法。在对检索结果进行融合处理时采用建立专业词典的方法来提取主题,并进行主题分类,同时通过记录用户感兴趣的主题,为用户提供个性化服务。  相似文献   

6.
Internet上信息资源的飞速膨胀造成用户在进行信息检索时的不便,传统的搜索引擎不能很好地解决这个问题。因此提出了一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立个人模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,同用户模型聚类相结合返回给用户个性化的搜索结果。分析了个性化元搜索引擎的系统构成,详细介绍了每个模块的功能,最后展望了它的发展前景。  相似文献   

7.
基于聚类的个性化元搜索引擎设计   总被引:2,自引:0,他引:2  
Internet上信息资源的飞速膨胀造成用户在进行信息检索时的不便,传统的搜索引擎不能很好地解决这个问题。因此提出了一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立个人模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,同用户模型聚类相结合遗回给用户个性化的搜索结果。分析了个性化元搜索引擎的系统构成,详细介绍了每个模块的功能,最后展望了它的发展前景。  相似文献   

8.
搜索引擎返回的结果太多且不能根据用户的兴趣提供检索结果是当前较受关注的问题。把用户兴趣模型和STC聚类算法相结合,提出了改进的STC算法,并提出个性化推荐的策略和兴趣描述更新的方法,实现了一个基于搜索结果的个性化推荐系统(SRPRS)。SRPRS基于改进的STC算法自动组织搜索结果,帮助用户利用主题的方式发现所需的资源。通过实验,分析了SRPRS系统的聚类特性和时间特性。针对搜索引擎的列表显示结果,SRPRS系统在快速查找用户感兴趣的文档上有较好的性能。  相似文献   

9.
卫琳 《微机发展》2007,17(9):65-67
搜索引擎返回的信息太多且不能根据用户的兴趣提供检索结果,使得用户使用搜索引擎难以用简便的方式找到感兴趣的文档。个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法。文中把内容过滤技术和文档聚类技术相结合,实现了一个基于搜索结果的个性化推荐系统,以聚类的方法自动组织搜索结果,主动推荐用户感兴趣的文档。通过建立用户概率兴趣模型,对搜索结果STC聚类的基础上进行内容过滤。实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化。  相似文献   

10.
针对当前元搜索引擎存在的问题,提出一种个性化元搜索结果整合算法。首先对成员搜索引擎根据相应条件设定权值,对各成员搜索引擎得到的搜索结果按贡献量加权分块排序,根据用户检索词条与兴趣库和元搜索结果的文本相关度对块内搜索结果进行整合排序。实验结果表明,该算法能够满足不同用户的个性化需求,在保证了搜索结果查全率的同时提高了查准率,很大程度上改善了用户检索效果和效率。  相似文献   

11.
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

12.
基于本体的医疗信息搜索技术   总被引:3,自引:0,他引:3       下载免费PDF全文
针对医疗信息联合搜索中存在的问题,提出一种基于医疗领域本体的多信息融合搜索方法。该方法采用信息抽取技术自动构建本体实例,运用医疗领域本体对用户查询请求进行语义处理,同时实现了基于该方法的原型系统。实验结果表明,该原型系统能有效返回多种相关信息,从而说明了本体在多信息融合搜索方面的重要性。  相似文献   

13.
介绍Lucene的索引和排序技术,并对排序技术进行改进,利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现索引器、检索器、中文分析器等模块,完成一个基于Lucene的搜索引擎的应用。改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

14.
基于受限汉语的数据库自然语言接口技术研究   总被引:24,自引:0,他引:24  
介绍了一种新的基于受限汉语的数据库自然语言接口NLCQI(natural language (Chinese) query interface)的系统模型及设计框架.给出系统实现中具有特色的多栈结构的中间语言以及以关联路径搜索方法实现的中间语言向SQL转换的策略.实验表明,该系统采用的非过程化汉语查询句表达方式较自然,对汉语句型的理解、处理能力有较大的改进.  相似文献   

15.
Web语料库建设初探   总被引:2,自引:0,他引:2  
俞倩兰  温晓行 《计算机工程》2001,27(5):177-178,188
对网上中文信息语料库搜集技术的实现原理和关键技术进行了讨论和分析,介绍了基于Web网络的通信及网上自动获取信息的原理,讨论了中文信息处理中的分词技术及其发展,提出了一个网上《人民日报》语料库搜集技术的实现方案。  相似文献   

16.
李树成  田学东 《微机发展》2005,15(8):145-147
提出了一种结合最新TDT技术、基于增强学习的优先Web环境主题搜索策略,并以此设计主题搜索器系统。该系统通过引入基于领域知识的TDT文本分类技术,大大改进了基于关键字的Naive Bayes模型主题相似性判别的准确性;通过引入基于增强学习的页面评估函数特征化主题Web环境,有效地提高了稀有信息的搜索能力。试验结果表明,该系统具有较高的实用性。  相似文献   

17.
The commonly used genetic algorithm (GA)-based methods have some shortcomings in applications such as time-consuming and slow convergence. A novel enhanced genetic algorithm (EGA) technique is developed in this paper to overcome these problems in classical GA methods so as to provide a more efficient technique for system training and optimization. Two approaches are proposed in the EGA technique: Firstly, a novel group-based branch crossover operator is suggested to thoroughly explore local space and speed up convergence. Secondly, an enhanced MPT (Makinen-Periaux-Toivanen) mutation operator is proposed to promote global search capability. The effectiveness of the developed EGA is verified by simulations based on a series of benchmark test problems. The EGA technique is also implemented to train a neural-fuzzy predictor for real-time gear system monitoring. Test results show that the branch crossover operator and enhanced MPT mutation operator can effectively improve the convergence speed and global search capability. The EGA technique outperforms other related GA methods with respect to convergence speed and global search capability.  相似文献   

18.
A feature of many practical control systems is a Multi‐Input Multi‐Output (MIMO) interactive structure with one or more gross nonlinearities. A primary controller design task in such circumstances is to predict and ensure the avoidance of limit cycling conditions followed by achieving other design objectives. This paper outlines how such a system may be investigated using the Sinusoidal Input Describing Function (SIDF) philosophy quantifying magnitude, frequency and phase of any possible limit cycle operation. While Sinusoidal Input Describing function is a suitable linearization technique in the frequency domain for assessment of stability and limit cycle operation, it can not be employed in time domain. In order to be able to incorporate the time domain requirements in an overall controller design technique, the appropriate linearization technique suggested here is the Exponential Input Describing Function (EIDF). First, an evolutionary search based on a multi‐objective formulation is employed for the direct solution of the harmonic balance system matrix equation. The search is based on Multi‐Objective Genetic Algorithms (MOGA) and is capable of predicting specified modes of theoretically possible limit cycle operation. Second, the design requirements in time as well as frequency domain are formulated by a set of constraint inequalities. A numerical synthesis procedure also based on Multi‐Objective Genetic Algorithm is employed to adjust the initial compensator parameters to meet the imposed constraints. Robust stability and robust performance are investigated with respect to linearization uncertainty within the context of multiobjective formulation. In order to make the Genetic Algorithm (GA) search more amenable to design trade‐off between different and often contradictory specifications, a weighted sum of the functions is introduced. This criterion is subsequently optimized subject to the nonlinear system dynamics and a set of design requirements. Examples of use are given to illustrate the effectiveness of the proposed approach.  相似文献   

19.
博客作为一种用户发表其观点和看法的载体已成为Web上一个重要的情感抒发与交流平台,博文搜索为这种交流提供了方便快捷的途径.很多时候,用户进行博文搜索时更关注作者对事件所持的观点或情感,但目前的博文搜索返回结果大多基于主题而非情感倾向.基于此提出一种基于句法依存分析技术的算法SOAD(sentiment orientation analysis based on syntactic dependency)对博文搜索结果进行情感倾向性分析.基于SOAD算法,构建了一个中文博文搜索原型系统,对博文搜索结果进行再处理.实验证明,一方面,SOAD算法在分析博文情感上具有更大的优势;另一方面,建立的原型系统实现了依据情感倾向返回搜索结果的目标.  相似文献   

20.
《Artificial Intelligence》2006,170(4-5):385-408
Recent work shows that the memory requirements of A* and related graph-search algorithms can be reduced substantially by only storing nodes that are on or near the search frontier, using special techniques to prevent node regeneration, and recovering the solution path by a divide-and-conquer technique. When this approach is used to solve graph-search problems with unit edge costs, we show that a breadth-first search strategy can be more memory-efficient than a best-first strategy. We also show that a breadth-first strategy allows a technique for preventing node regeneration that is easier to implement and can be applied more widely. The breadth-first heuristic search algorithms introduced in this paper include a memory-efficient implementation of breadth-first branch-and-bound search and a breadth-first iterative-deepening A* algorithm that is based on it. Computational results show that they outperform other systematic search algorithms in solving a range of challenging graph-search problems.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号