共查询到20条相似文献,搜索用时 586 毫秒
1.
2.
传统的搜索引擎性能评价方法需要人工标注标准答案集,需花费大量的人力物力,并且评价结果依赖于人工标注的准确性,效率较低。该文基于聚类分析的思路,提出了一种搜索引擎性能评价指标和自动进行搜索引擎性能评价的方法,此方法能自动计算信息类查询的覆盖范围,并根据其覆盖范围对检索结果进行聚类,通过类间距和类内距等指标实现检索性能的自动评价。实验结果表明,基于聚类指标的评价方法与人工标注的评价方法的评价结果是相一致的。 相似文献
3.
随着国际互连网Internet的不断发展与壮大,其信息量快速、无序的增长,如何设计一个新的搜索引擎,使用户方便地合理地组织和挖掘纷繁复杂的数据,本文从纯文本的聚类分析技术来开发带有链接的超文本数据,对所有蕴涵其中的信息进行挖掘,使用户对信息的挖掘从混乱走向有序。 相似文献
4.
随着互联网信息化的快速发展,网络求职人数不断增多,主题搜索引擎正成为新一代的主流搜索引擎。本文就面向毕业生求职帮助信息为主题的搜索引擎进行了研究,通过提出主题搜索引擎的关键技术,提出了求职帮助信息的搜索引擎的设计方案。 相似文献
5.
随着Web信息的急剧增长使搜索引擎专用化成为发展趋势.根据当前的需求提出了实现建筑业信息搜索引擎设计方法.重点论述主题搜索引擎的信息采集策略,并给出了一种比较理想的建筑业信息搜索引擎设计方案. 相似文献
6.
聂璐 《数字社区&智能家居》2009,(9X):7736-7737
网络信息挖掘能为管理决策起到至关重要的作用。该文在明确搜索引擎及信息挖掘意义的基础上,分析了搜索引擎的工作原理,并通过研究网络信息挖掘系统,探讨了搜索引擎在网络信息挖掘中的应用设计及实现。 相似文献
7.
首先分析了搜索引擎的工作原理,其次简要设计了搜索引擎在网络信息挖掘中应用,并进一步研究了搜索引擎的应用实现,涉及到挖掘预处理、挖掘训练以及信息文件的操作。对搜索引擎的应用研究起到一定的借鉴作用。 相似文献
8.
9.
10.
在巨大的Internet/Web信息中很难积极地搜索到准确的信息,搜索引擎技术解决了用户检索Web信息困难的问题,而现有的搜索引擎返回的信息却并不总令用户满意。文中在对MAS理论调研的基础上,提出一个基于MAS的搜索引擎的模型,并将其与著名的Google搜索引擎作比较和分析。 相似文献
11.
CHEN Ju-hong 《数字社区&智能家居》2008,(34)
随着英特网上信息量的迅速增长,用户想要从中找到感兴趣的信息变得越来越困难,传统的搜索引擎不能很好地解决这个问题。因此本文提出了一种带有聚类功能的个性化元搜索引擎,系统通过用户注册获得用户数据并对所有的用户进行聚类形成不同用户群病产生用户模式,搜索引擎调度模块通过用户模式来选择适合的搜索引擎进行调度得到个性化的搜索结果,再将检索到的结果进行聚类处理,返回给用户个性化的搜索结果。分析了带有聚类功能的个性化元搜索引擎的系统构成,详细介绍了每个模块的功能,最后展望了它的发展前景。 相似文献
12.
陈菊红 《数字社区&智能家居》2008,3(12):1581-1582
随着英特网上信息量的迅速增长,用户想要从中找到感兴趣的信息变得越来越困难,传统的搜索引擎不能很好地解决这个问题。因此本文提出了一种带有聚类功能的个性化元搜索引擎,系统通过用户注册获得用户数据并对所有的用户进行聚类形成不同用户群病产生用户模式,搜索引擎调度模块通过用户模式来选择适合的搜索引擎进行调度得到个性化的搜索结果,再将检索到的结果进行聚类处理,返回给用户个性化的搜索结果。分析了带有聚类功能的个性化元搜索引擎的系统构成,详细介绍了每个模块的功能,最后展望了它的发展前景。 相似文献
13.
应用链接分析的web搜索结果聚类 总被引:3,自引:0,他引:3
随着web上信息的急剧增长,如何有效地从web上获得高质量的web信息已经成为很多研究领域里的热门研究主题之一,比如在数据库,信息检索等领域。在信息检索里,web搜索引擎是最常用的工具,然而现今的搜索引擎还远不能达到满意的要求,使用链接分析,提出了一种新的方法用来聚类web搜索结果,不同于信息检索中基于文本之间共享关键字或词的聚类算法,该文的方法是应用文献引用和匹配分析的方法,基于两web页面所共享和匹配的公共链接,并且扩展了标准的K-means聚类算法,使它更适合于处理噪音页面,并把它应用于web结果页面的聚类,为验证它的有效性,进行了初步实验,实验结果显示通过链接分析对web搜索结果聚类取得了预期效果 相似文献
14.
基于服务器集群的云检索系统的研究与示范 总被引:1,自引:0,他引:1
在研究云计算及移动搜索引擎的基础上,依据当前技术发展,提出了基于服务器集群的云检索系统模型,该模型由云信息层、云检索集群系统和用户查询框组成.对云检索集群系统中数据存储技术进行了深入研究,提出了分布式云检索数据存储方案.为了提高云检索执行效率,提出了以程序流为核心的云检索软件执行模式.该模型的测试结果表明,系统功能能正确实现,性能表现较好且稳定.通过该模型的示范,给海量信息检索技术提供了拓展思维的方案. 相似文献
15.
目前随着信息检索技术的不断深入,信息检索技术中的聚类分析也得到了不断的发展,特别是随着各种数据源的大量涌现,如图像数据,文本数据,DNA数据,时间序列数据,Web数据等等,聚类分析越来越受到重视,对聚类的研究已经成为信息检索领域中一个非常活跃的研究课题。论文以聚类分析方法为理论基础,利用面向对象编程技术完成了一个聚类软件,应用该聚类软件,可对信息实现快速检索,具有实用价值。 相似文献
16.
数据挖掘中聚类分析的技术方法 总被引:31,自引:21,他引:31
数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析是数据挖掘中的核心技术,本文对数据挖掘领域的聚类分析方法及代表算法进行分析,并从多个方面对这些算法性能进行比较,同时还对聚类分析在数据挖掘中的几个应用进行了阐述。 相似文献
17.
搜索引擎技术是近年来计算机领域中的一个研究热点,如何从Internet的海量信息中快速地获取有效信息的计算平台和方法是它的研究核心内容之一.提出了一种构建高速并行多元搜索引擎方案.它基于CORBA平台和技术,在PC机群系统上构建一个分布并行的多元搜索引擎,具有费用低、可复用和容易维护的优点. 相似文献
18.
对因特网上较著名的搜索引擎站点进行了详尽分析,着重分析了中文搜索引擎的特点,以及搜索引擎的主要评价标准。最后介绍了国内主要搜索引擎,为人们从因特网上更好地检索信息提供初步指南。 相似文献
19.
姚明 《数字社区&智能家居》2007,(10):83-84
搜索引擎是获取网络信息的重要手段,本文通过对搜索引擎的现状、使用情况的调查研究,分析了搜索引擎的不足,并对搜索引擎的未来发展进行了简单的介绍。 相似文献
20.
为有效地弥补全文搜索引擎的不足,提出了一种动态求解的最优密度聚类算法并加以实现.该算法构造了一颗簇关系树,将两种典型聚类算法:密度聚类算法DBSCAN和层次聚类算法BIRCH进行有效结合,对聚类参数ε进行动态求解,以达到参数ε的最优.与其它文本聚类算法相比,该算法的查询结果与用户感兴趣的主题相关度较大,对具有二义性的关键词有较高的查准率,能有效提升搜索引擎的查询效率,加快用户搜索信息的速度. 相似文献