首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
孔德镛  张建军 《计算机工程》2010,36(19):203-204,207
针对元搜索引擎的查准率等问题,分析专业元搜索引擎返回结果的专业相关度问题,提出一种基于遗传算法的网页排序算法,讨论算法的原理及实现过程。在独立搜索引擎返回结果中,挖掘除位置信息以外的其他信息,利用遗传算法建立专业网页相关度模型,对网页的专业相关度进行计算。实验结果表明该算法效果较好。  相似文献   

2.
元搜索引擎是一站式搜索引擎,促进人们对网络信息资源的有效利用。通过元搜索引擎的概念、特点和工作原理介绍,对比独立搜索引擎,指出元搜索引擎的资料挖掘等不足,倾向网络搜索,专业搜索欠缺,指出元搜索引擎资料挖掘的发展方向。  相似文献   

3.
元搜索引擎是一站式搜索引擎,促进人们对网络信息资源的有效利用.通过元搜索引擎的概念、特点和工作原理介绍,对比独立搜索引擎,指出元搜索引擎的资料挖掘等不足,倾向网络搜索,专业搜索欠缺,指出元搜索引擎资料挖掘的发展方向.  相似文献   

4.
夏斌  徐彬 《电脑开发与应用》2007,20(5):16-17,20
针对目前搜索引擎返回候选信息过多从而使用户不能准确查找与主题有关结果的问题,提出了基于超链接信息的搜索引擎检索结果聚类方法,通过对网页的超链接锚文档和网页文档内容挖掘,最终将网页聚成不同的子类别。这种方法在依据网页内容进行聚类的同时,充分利用了Web结构和超链接信息,比传统的结构挖掘方法更能体现网站文档的内容特点,从而提高了聚类的准确性。  相似文献   

5.
李建廷 《计算机仿真》2010,27(7):138-140,161
元搜索引擎将检索要求提交给多个成员搜索引擎,并将搜索到的网页按照一定的优先关系排列并显示给用户.如何把各成员搜索引擎的结果有机的融合在一起,进一步提高元搜索引擎的查准率,对元搜索引擎来说具有重要的意义.模糊积分算法利用各个信息源提供的信息和权值来为决策过程提供必要的数据,这种类型的信息融合能够解决信息提取和处理过程中的不确定性.实验表明利用模糊积分思想进行结果排序的算法,从一定程度上能够把搜索引擎的结果有机的融合在一起,进一步提高元搜索引擎的查准率.  相似文献   

6.
面向主题的元搜索引擎   总被引:1,自引:0,他引:1  
介绍了一种基于神经网络的面向主题的元搜索引擎.它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜索引擎中普遍存在搜索结果不准确、信息滞后等问题.实验结果表明,该方法时结果进行了最优化排序,实际执行性能较好.  相似文献   

7.
牛凯 《中国信息化》2014,(11):52-54
随着数字化校园的迅速发展,搜索引擎技术得到广泛应用,Web数据挖掘作为数据挖掘技术的一种也应运而生。搜索引擎是基于Web数据挖掘的一个重要研究方向,校园网信息每天以不可估量的速度增长.数以万计的网页资源让师生在浩瀚的信息海洋中眼花缭乱,而搜索引擎的出现则很好的解决了这一现实问题。  相似文献   

8.
基于Lucene 网页排序算法的改进   总被引:2,自引:1,他引:2  
在分析现有的词频位置加权排序法、Direct Hit算法、PageRank算法和Lucene的网页排序算法后,将这三种著名的算法思想运用到Lucene的网页排序算法中,并设计了一个基于Lucene的糖业专业搜索引擎,重点介绍该搜索引擎的检索功能。最后,通过在所设计好的糖业专业搜索引擎进行实验,验证改进后Lucene的网页排序算法,实验结果表明改进后的排序算法能够提高检索结果的质量,能够更准确地将结果信息反馈给用户。  相似文献   

9.
由于网络上信息数量庞大,多元搜索引擎可能会产生一个相当大的结果集,本文借鉴了Web挖掘中聚类算法FCMA和网页排序算法HITS的技术和思想,改进了多元搜索引擎的结构,以提高系统的查询效率.  相似文献   

10.
由于不同的维吾尔文网站采用了不同的字符编码或不同的字库体系,使得单一的搜索引擎很难兼顾不同的维吾尔文网页信息.针对维吾尔文网页内容检索特点,提出了利用元搜索引擎完成网页信息采集,通过信息过滤技术从动态的信息流中抽取出符合用户个性化需求的信息条目,经去重后栽入采集数据库,通过与敏感信息库进行比对,发掘出发布特定信息的网页.  相似文献   

11.
介绍了一个基于专业搜索引擎的元搜索引擎,提出了一种将专业搜索引擎与专门搜索"Invisible Web"检索工具相结合的方法。在对检索结果进行融合处理时采用建立专业词典的方法来提取主题,并进行主题分类,同时通过记录用户感兴趣的主题,为用户提供个性化服务。  相似文献   

12.
定题搜索引擎Robot的设计与算法   总被引:6,自引:0,他引:6  
定题搜索引擎将信息检索限定在特定主题领域,提供特定主题的信息检索服务,是新一代搜索引擎的发展方向之一。该文介绍了一个定题搜索robot系统NetBat 2.02版,它可以实现在web上爬行下载主题相关网页。定题搜索的关键技术是主题相关信息的搜索及网页相关度分析。该文分析了传统定题搜索算法的优缺点,提出了基于反向链接结合超链文本分析的定题搜索算法。文章还对基于内容的网页相关度分析算法进行了详细的论述。对比搜索实验表明系统有着较好的性能,能准确地爬行到主题相关网页。  相似文献   

13.
基于元搜索引擎的多关键词检索技术   总被引:7,自引:1,他引:7  
文章根据主要中文搜索引擎Google和Baidu对多关键词的查询处理存在的缺陷,提出了“核心关键词”的概念和“分级权重”的计算方法;并进而提出了将基本搜索引擎搜索结果与网页内容分析合并相关度算法和元搜索引擎的准确度偏差评价公式。研究表明,元搜索引擎不但消除了死链接和重复链接,而且准确度偏差与Google和Baidu相比,分别减少7.26%和12.47%,准确度得到了一定提高。  相似文献   

14.
利用模糊积分融合方法,给出了一个完整的智能元搜索引擎系统。采用智能搜索代理的设计框架,实现系统的高度并发性,使系统具有一定的智能性。结合决策树算法和遗传算法对搜索源的调度作了优化。提出使用模糊积分原理应用于结果集的融合技术,并给出了具体算法。通过在Web上的实际测试,在相同条件下同常用的搜索引擎和其他元搜索引擎分别作了比较,证实了本文所描述的元搜索引擎有着更好的搜索效果。  相似文献   

15.
张丽  张福顺 《信息与控制》2004,33(3):277-280
主要介绍了虚拟企业中伙伴企业搜索引擎系统的设计方法.该系统是一个专门搜集企业信息的专业型搜索引擎,它以元搜索为思想基础,利用网络机器人和信息抽取工具搜索大量准确可靠的企业信息,还具有邮件群发、企业注册等多项功能.该系统为虚拟企业提供了一个查找企业信息的平台,使得盟主能够更快捷、方便地找到适合某种特定任务的伙伴企业.  相似文献   

16.
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案。  相似文献   

17.
基于Rhino的JavaScript动态页面解析研究与实现   总被引:1,自引:0,他引:1  
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取.鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案.实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案.  相似文献   

18.
Internet上信息资源的飞速膨胀造成用户在进行信息检索时的不便,传统的搜索引擎不能很好地解决这个问题。因此提出了一种基于聚类的个性化元搜索引擎模型,系统通过对用户建立个人模型,对此模型进行聚类形成不同用户群,并对检索到的结果进行聚类处理,同用户模型聚类相结合返回给用户个性化的搜索结果。分析了个性化元搜索引擎的系统构成,详细介绍了每个模块的功能,最后展望了它的发展前景。  相似文献   

19.
一种基于Agent的智能元搜索引擎框架   总被引:10,自引:0,他引:10  
Internet上信息资源的飞速膨胀造成了用户信息检索时的不便,传统搜索引擎不能很好地解决这个问题。论文针对这一情况介绍了Agent及元搜索引擎技术,认为这两者的结合能满足用户信息检索时的个性化、智能化要求。文中给出了一个基于Agent的智能元搜索引擎系统体系结构,阐述了设计思想,介绍了系统的工作原理,并重点说明了各模块的工作机理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号