共查询到20条相似文献,搜索用时 78 毫秒
1.
搜索引擎的文档预处理技术研究 总被引:2,自引:0,他引:2
搜索引擎的Robots(自动采集器)对WWW站点进行搜索,并将搜索到WWW页面信息存入搜索引擎的临时数据库,然后再对页面信息进行整理,形成规范的页面索引,存入索引数据库,供用户查询。设计搜索引擎的第一步就是对输入的各项进行规格化处理,使之标准化。在建立索引文件之前,文档里的信息要进行处理,例如文档标准、索引词抽取,这个过程称为项目规格化(Item normalization)。项目规格化分三步进行:建立可搜索的数据库结构,禁用词表使用和抽取词干。 相似文献
2.
基于归类的链接分析技术 总被引:1,自引:0,他引:1
在目前主流搜索引擎中,链接分析是最常用的计算网页价值度的工具,但是对于用户输入比较宽泛的查询主题,链接分析算法很难得到一个令所有用户都满意的结果。论文试图从另外一个角度来改进链接分析算法,即在传统的链接分析基础上,增加Web聚类算法的有关思想,并对这两种算法进行了改进和组合,提出了一种基于归类的链接分析技术,并用实验结果证明了该算法的性能。 相似文献
3.
王梅 《数字社区&智能家居》2009,(24)
该文就搜索引擎中链接结构算法问题进行研究,分析了PageRank和HITS两种不同的算法,并对算法中明显的缺陷提出了改进措施。通过测试,验证使用改进的算法在搜索质量等方面有明显提高。 相似文献
4.
5.
基于弱实时系统的元搜索引擎合成策略 总被引:2,自引:0,他引:2
本文根据弱实时系统理论提出一种新的元搜索引擎结果合成策略,与现有系统相比可以较好把握系统响应时间与准确率的平衡,提高元搜索引擎的搜索速度和性能,并具有进一步深入研究的价值。 相似文献
6.
相似文档检索在文档管理中是很重要的,提出一种在大文档集中基于模糊聚类的快速高效的聚类方法,传统方法大都通过词与词之间的比较来检索文档,该方法让文档通过两层结构得出相似度。系统用预定义模糊簇来描述相似文档的特征向量,用这些向量估计相似度,由此得出文档之间的距离,系统应用了新的相似性度量方法,并通过实验证实了其可行性和高效性。 相似文献
7.
8.
9.
10.
相信很多朋友都喜欢使用Google文档。如果你需要在编辑过程中引用某些搜索结果,通常的做法是另行打开一个页面进行搜索操作,然后将搜索结果插入文档,然而这样操作起来未免相当麻烦。其实,我们可以在编辑界面下直接链接搜索结果。 相似文献
11.
阐述基于代理的元搜索引擎的系统结构和的基本概念、存在的不足,介绍代理技术以及代理的基本结构.提出基于代理的元搜索引擎的体系结构.并详细介绍系统各个组成部分. 相似文献
12.
搜索引擎技术及其发展趋势 总被引:2,自引:0,他引:2
搜索引擎是人们在使用Internet信息资源时的重要工具.本文分析了现有搜索引擎技术的原理以及存在的不足,并介绍了未来搜索引擎技术的主要发展趋势. 相似文献
13.
基于本体的搜索引擎研究 总被引:1,自引:0,他引:1
由于目前搜索引擎的查全率和准确率太低,提出了一种基于本体的搜索引擎概念模型;这种搜索引擎不仅仅基于关键词检索,而且机器能够理解Web页面的内容,并进行逻辑推理来完成复杂的查询任务,最终返回精确的结果。 相似文献
14.
企业网络搜索引擎营销策略探讨 总被引:1,自引:0,他引:1
基于搜索引擎平台的网络营销,搜索引擎营销是利用人们对搜索引擎的依赖和使用惯性,在人们检索信息时尽可能将销售信息传递给目标客户.针对黄石兴华生化有限公司门户网站的具体情况,把该公司搜索引擎营销的重点放在搜索引擎优化上,并给出搜索引擎营销实施措施. 相似文献
15.
搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库.因此网页索引库建立的好坏直接影响最后的查询结果的准确性和用户的查询速度.本文提出了一种建立倒排索引的算法并进行了分析和研究. 相似文献
16.
首先对智能搜索引擎做了简要概述,接着提出了一种新的搜索引擎的设计思路,并针对独立搜索引擎的不足,独立搜索引擎与元搜索引擎结合起来,提高了搜索引擎的精度和效率. 相似文献
17.
本文对当前的搜索引擎原理进行了简要的分类介绍,概述了中文搜索引擎的特殊性和难点,并给出了两种中文分词算法。 相似文献
18.
19.
20.
在教育网内FTP站点资源不断丰富的情况下,具备快速文件检索能力的搜索引擎对高校师生来说尤为重要.本文从分析高校FTP搜索引擎系统的整体结构出发,主要研究其信息采集技术的三个组件.并对提高搜索引擎效率的其他技术进行了详尽阐述. 相似文献