首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
搜索引擎的文档预处理技术研究   总被引:2,自引:0,他引:2  
搜索引擎的Robots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询。设计搜索引擎的第一步就是对输入的各项进行规格化处理,使之标准化。在建立索引文件之前,文档里的信息要进行处理,例如文档标准、索引词抽取,这个过程称为项目规格化(Item normalization)。项目规格化分三步进行:建立可搜索的数据库结构,禁用词表使用和抽取词干。  相似文献   

2.
基于归类的链接分析技术   总被引:1,自引:0,他引:1  
王元珍  陈涛 《计算机工程与应用》2005,41(13):172-173,203
在目前主流搜索引擎中,链接分析是最常用的计算网页价值度的工具,但是对于用户输入比较宽泛的查询主题,链接分析算法很难得到一个令所有用户都满意的结果。论文试图从另外一个角度来改进链接分析算法,即在传统的链接分析基础上,增加Web聚类算法的有关思想,并对这两种算法进行了改进和组合,提出了一种基于归类的链接分析技术,并用实验结果证明了该算法的性能。  相似文献   

3.
该文就搜索引擎中链接结构算法问题进行研究,分析了PageRank和HITS两种不同的算法,并对算法中明显的缺陷提出了改进措施。通过测试,验证使用改进的算法在搜索质量等方面有明显提高。  相似文献   

4.
搜索引擎中的聚类浏览技术   总被引:1,自引:0,他引:1  
搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,方便地找到感兴趣的信息。本文介绍了搜索引擎的聚类浏览技术对聚类算法的基本要求及其分类方法,研究分析了主要聚类算法及其改进方法的特点,讨论了对聚类质量的评价,最后指出了聚类浏览技术的发展趋势。  相似文献   

5.
基于弱实时系统的元搜索引擎合成策略   总被引:2,自引:0,他引:2  
本文根据弱实时系统理论提出一种新的元搜索引擎结果合成策略,与现有系统相比可以较好把握系统响应时间与准确率的平衡,提高元搜索引擎的搜索速度和性能,并具有进一步深入研究的价值。  相似文献   

6.
相似文档检索在文档管理中是很重要的,提出一种在大文档集中基于模糊聚类的快速高效的聚类方法,传统方法大都通过词与词之间的比较来检索文档,该方法让文档通过两层结构得出相似度。系统用预定义模糊簇来描述相似文档的特征向量,用这些向量估计相似度,由此得出文档之间的距离,系统应用了新的相似性度量方法,并通过实验证实了其可行性和高效性。  相似文献   

7.
首先总结了链接挖掘中基于属性—链接聚类算法的研究现状;然后把它大体分为三类,对每一类中具有代表性的算法进行了详细介绍、分析和评价;最后指出了该领域进一步的研究方向。  相似文献   

8.
针对复杂信息网络中多链接高维数据聚类难以处理且效率较低问题,提出了一种新颖的基于高阶张量分析方法和模块化网络分析方法相结合的链接聚类算法。利用模块化方法分析网络,利用张量的形式表示多维的复杂的多链接数据,利用Tucker张量分解的方法对数据降维处理,降低了算法的时间和空间复杂度。并在复杂网络环境下,通过实验验证了算法的有效性和健壮性。  相似文献   

9.
搜索引擎结果聚类算法研究   总被引:5,自引:1,他引:5  
随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找。而对搜索引擎结果聚类能使用户在更高的主题层次上来查看搜索引擎返回的结果。该文提出了搜索引擎结果聚类的几个重要指标并给出了一个新的基于PAT—tree的搜索引擎结果聚类算法。  相似文献   

10.
王临 《电脑迷》2012,(8):78-78
相信很多朋友都喜欢使用Google文档。如果你需要在编辑过程中引用某些搜索结果,通常的做法是另行打开一个页面进行搜索操作,然后将搜索结果插入文档,然而这样操作起来未免相当麻烦。其实,我们可以在编辑界面下直接链接搜索结果。  相似文献   

11.
阐述基于代理的元搜索引擎的系统结构和的基本概念、存在的不足,介绍代理技术以及代理的基本结构.提出基于代理的元搜索引擎的体系结构.并详细介绍系统各个组成部分.  相似文献   

12.
搜索引擎技术及其发展趋势   总被引:2,自引:0,他引:2  
搜索引擎是人们在使用Internet信息资源时的重要工具.本文分析了现有搜索引擎技术的原理以及存在的不足,并介绍了未来搜索引擎技术的主要发展趋势.  相似文献   

13.
基于本体的搜索引擎研究   总被引:1,自引:0,他引:1  
张体首  蔡明 《微计算机信息》2006,22(36):242-244
由于目前搜索引擎的查全率和准确率太低,提出了一种基于本体的搜索引擎概念模型;这种搜索引擎不仅仅基于关键词检索,而且机器能够理解Web页面的内容,并进行逻辑推理来完成复杂的查询任务,最终返回精确的结果。  相似文献   

14.
企业网络搜索引擎营销策略探讨   总被引:1,自引:0,他引:1  
郭衍超  涂进 《现代计算机》2010,(2):102-104,112
基于搜索引擎平台的网络营销,搜索引擎营销是利用人们对搜索引擎的依赖和使用惯性,在人们检索信息时尽可能将销售信息传递给目标客户.针对黄石兴华生化有限公司门户网站的具体情况,把该公司搜索引擎营销的重点放在搜索引擎优化上,并给出搜索引擎营销实施措施.  相似文献   

15.
搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库.因此网页索引库建立的好坏直接影响最后的查询结果的准确性和用户的查询速度.本文提出了一种建立倒排索引的算法并进行了分析和研究.  相似文献   

16.
首先对智能搜索引擎做了简要概述,接着提出了一种新的搜索引擎的设计思路,并针对独立搜索引擎的不足,独立搜索引擎与元搜索引擎结合起来,提高了搜索引擎的精度和效率.  相似文献   

17.
本文对当前的搜索引擎原理进行了简要的分类介绍,概述了中文搜索引擎的特殊性和难点,并给出了两种中文分词算法。  相似文献   

18.
基于Intranet的搜索引擎   总被引:3,自引:0,他引:3  
分析了Intranet的特点,指出了Intranet中搜索引擎设计的特殊性。目前Intranet上的搜索引擎存在着许多问题,提出了如何在Intranet内部搜索引擎的设计上解决这些问题。  相似文献   

19.
本文对当前的搜索引擎原理进行了简要的分类介绍,概述了中文搜索引擎的特殊性和难点,并给出了两种中文分词算法。  相似文献   

20.
在教育网内FTP站点资源不断丰富的情况下,具备快速文件检索能力的搜索引擎对高校师生来说尤为重要.本文从分析高校FTP搜索引擎系统的整体结构出发,主要研究其信息采集技术的三个组件.并对提高搜索引擎效率的其他技术进行了详尽阐述.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号