首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
面向主题元搜索引擎的设计与实现   总被引:1,自引:0,他引:1  
王津涛  兰皓 《计算机工程》2005,31(7):168-169,173
独立搜索引擎的选择策略是实现面向主题元搜索引擎的关键技术之一,独立搜索引擎序列的优劣直接影响整个系统的性能。由于每个独立搜索引擎各个方面存在着差异,它们的性能时刻变化,很难对独立搜索引擎序列进行具体的数值上的评测。利用改进后的遗传算法可以根据各个独立搜索引擎性能的变化动态调整独立搜索引擎序列,从而使系统具有较好的自适应性。  相似文献   

2.
面向主题的元搜索引擎   总被引:1,自引:0,他引:1  
介绍了一种基于神经网络的面向主题的元搜索引擎.它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜索引擎中普遍存在搜索结果不准确、信息滞后等问题.实验结果表明,该方法时结果进行了最优化排序,实际执行性能较好.  相似文献   

3.
中文搜索引擎概念检索初探   总被引:19,自引:1,他引:18  
搜索引擎传统的关键词匹配检索模式存在很多问题,概念检索是解决这些问题的关键技术之一。该文简要介绍了概念检索的主要内容,针对中文搜索引擎,探索出了一种基于概念语义网络知识库的概念检索模型。在此基础上,针对计算机这一特定领域,创建了一个含有500多个概念节点,包括概念层次关系和近300种概念相关关系的语义网络,初步实现了计算机领域文档的概念检索。实验结果表明,该模型对于提高中文搜索引擎的智能水平是非常有效的。  相似文献   

4.
莫倩  张树  王芳 《计算机工程与应用》2012,48(21):112-117,150
传统的主题搜索技术难以适应大范围垂直领域的智能搜索需求,通过将主题搜索与语义搜索相关技术分别应用到搜索引擎的数据采集与智能查询过程中,利用基于层次分类模型的领域数据采集机器人,完成对领域信息的精准采集,基于中文百科资源自动构建领域本体,将大规模领域本体库用于搜索引擎的语义扩展推理中,实现了一个面向领域的智能搜索引擎。实验结果表明,基于层次结构的领域分类具有较高的分类准确率和召回率,与其他搜索引擎相比较,该系统具有领域专业性强、领域易于移植、检索更加智能等特点。  相似文献   

5.
随着信息化的高速发展,信息量正以指数规律迅猛增长,互联网己经成为人类最重要的海量信源,信息迷航和信息过载已经成为日益严重的问题。就面向主题搜索引擎的关键技术进行研究,并提出一种基于Lucene的面向主题的搜索引擎解决方案,研究实现材料信息主题搜索引擎(FSEMI)。  相似文献   

6.
随着互联网的迅速发展,网页数量越来越多。人们对于网络信息专业化的需求导致了主题搜索引擎的诞生,而网络爬行器效率的高低以及算法的优劣将直接影响搜索引擎的很多性能指标,该文以高校为主题,探讨了设计主题爬行器的几个关键性问题。  相似文献   

7.
面向主题的概念检索研究   总被引:2,自引:1,他引:2  
该文提出了一种基于概念网络和主题概念树的面向主题的文本检索算法。依托概念网络建立主题概念树,利用主题概念树对用户的查询请求进行语义扩展,实现同义和语义蕴涵检索。关联度的计算模型考虑了词与词之间,句与句之间的语义激励。通过关联度在主题概念树上的传播模型,实现复合概念关联度的计算。检索结果按关联度大小降序排列。基于主题概念树的概念检索导航为用户检索提供了便利。  相似文献   

8.
分析了商业领域搜索引擎与传统搜索引擎的区别.为满足商业需求,需要对传统的搜索引擎进行改进.设计了一种面向商业领域搜索引擎的系统架构,并着重对索引部分的设计与实现进行了详细的分析.  相似文献   

9.
基于WEB的面向主题搜索引擎的设计与实现   总被引:3,自引:2,他引:3  
针对目前通用搜索引擎所搜索到的结果过多、与主题相关性不强的情况,提出了面向主题的搜索引擎,并从系统结构方面将系统划分为特征提取、存取分析以及搜索控制等3个子系统,并给出了其具体的实现策略。  相似文献   

10.
针对基于关键字的搜索引擎缺乏语义的问题,提出了一种面向专业领域的语义搜索引擎模型.以领域本体形式化描述为基础,构建本体语义框架,进而给出语义搜索模型.在模型中,以概念、概念-实例以及关键字等3种扩展特征项作为基础,对查询扩展算法和文档语义标注算法进行了研究,并且构建了语义索引,通过引入向量空间模型判定扩展检索词与语义文档的相似度.实验结果表明,该模型较传统模型较大提高了检索的查准率和查全率.  相似文献   

11.
智能搜索引擎的分析与研究   总被引:1,自引:0,他引:1  
针对搜索引擎现存的不足,提出了基于神经网络的智能搜索引擎开发模型,并对该模型采用的相关技术进行了阐述。  相似文献   

12.
一个WWW智能搜索引擎   总被引:9,自引:1,他引:8  
为避免传统搜索引擎带来的信息过量或丢失有用信息的现象,采用本体论、启发式检索和用户目标等人工智能新技术来设计搜索引擎,从而实现将检索的信息转化成用户有用的知识。  相似文献   

13.
该文在开源全文搜索引擎Lucene的基础上设计了一个结合本体与自然语言处理技术的语义检索系统。系统分析了如何对文本进行语义分析,设计了语义索引项以存储语义信息,并提出了使用语义信息的网页排序算法。  相似文献   

14.
设计了面向XML文档检索的搜索引擎模型,该模型包括机器人模块、转换模块、解析模块、索引模块和查询模块这五个部分。转换模块和解析模块是专门设计的。介绍了模型的设计思想及框架,详细描述了各模块的结构和实现思想。  相似文献   

15.
搜索引擎剖析   总被引:8,自引:0,他引:8  
刘琨  郑有才 《微机发展》2004,14(3):19-22
搜索引擎相关技术的研究是目前互联网的热门研究课题。现有搜索引擎利用了大量的计算机研究成果,了解现有搜索引擎的优点和不足同时在实现的搜索引擎中扬长避短,对搜索引擎的剖析是非常必要的。文中指出Google的PageR ank技术在处理超链接双向影响上的不足。在实现搜索引擎的过程中,充分利用分析的结果改进PageRank算法,从而充分利用网页间的超链接信息提高了搜索结果的有效性。  相似文献   

16.
中文分词作为机器翻译、文本分类、主题词提取以及信息检索的基础环节,近年来得到了广泛的关注。搜索引擎技术的广泛应用和中文信息处理的发展,使得全文检索和中文分词技术的研究逐渐深入,涌现出了众多优秀的中文分词算法。本文结合中文分词算法的研究现状,分析了分词技术与搜索引擎的信息检索相结合需要解决的关键技术问题,并讨论了中文分词技术在搜索引擎中的应用。  相似文献   

17.
智能Web中文主题信息收集系统IRobot的设计   总被引:4,自引:0,他引:4  
本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性, 系统采用了对待收集URL进行相关度预测为主, 对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中, 深入考虑了Web主题信息结构和组织特性的多种因素, 综合提高了系统的性能。相比已有的研究, 系统的精度和收集效率更高, 且更为稳定, 并能够自动获得主题领域内重要资源的列表。  相似文献   

18.
面向垂直搜索引擎的主题提取算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。  相似文献   

19.
该文提出了一种分布式信息检索系统,叫作协作式搜索引擎(CSE),它是由多个相互协作的本地元搜索引擎构成的。每一个本地搜索引擎都有它自己的索引数据库,能够很快地进行更新。CSE通过基于站点选择搜索和对Web文档计分等方法来减少通信延迟、缩短收集时间,实现快速收集、及时更新和定位准确,从而克服了目前的搜索引擎更新周期太长的缺点。  相似文献   

20.
站内搜索引擎是针对某个网站内部的全文检索服务,具备信息检索的核心技术。提出在文件系统上构建的解决方案,使用全文检索开发工具包——Lucene,实现站内搜索引擎系统。不仅针对关系数据库的数据,还对服务器文件系统上的各种非结构化文档数据进行加工、信息抽取,并创建索引文件进行搜索,最终实现对站内被检索数据的导航浏览,关键字高亮提示,筛选排序等。经过测试,检索效率较高,效果良好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号