首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
中文搜索引擎的原理剖析及开发实现技术   总被引:13,自引:0,他引:13  
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展,剖析了中文搜索引擎采用的核心技术-全文检索与中文分词技术,探讨了编程中应注意的问题和部分实现技术,并对中文搜索引擎的发展提出了几点建议。  相似文献   

2.
随着我国科学技术的进步,网络信息化的快速发展,搜索引擎成为了人们查找数据的最主要工具。在搜索引擎中,为了提高用户查找所需要数据信息的准确性和全面性,可以使用中文分词技术,中文分词技术在中文搜索引擎中占据了重要的地位。用户在使用中文分词技术对中文搜索引擎的查准率及查全率有着深刻的影响。  相似文献   

3.
中文分词作为机器翻译、文本分类、主题词提取以及信息检索的基础环节,近年来得到了广泛的关注。搜索引擎技术的广泛应用和中文信息处理的发展,使得全文检索和中文分词技术的研究逐渐深入,涌现出了众多优秀的中文分词算法。本文结合中文分词算法的研究现状,分析了分词技术与搜索引擎的信息检索相结合需要解决的关键技术问题,并讨论了中文分词技术在搜索引擎中的应用。  相似文献   

4.
开发中文搜索引擎汉语处理的关键技术   总被引:24,自引:0,他引:24  
严威  赵政 《计算机工程》1999,25(6):5-6,8
论述了开发中文搜索引擎语言方面的两项关键技术,即中文分词技术和汉化问题,介绍了几种解决方案,并在结尾展望了中文搜索引擎的未来。  相似文献   

5.
中文分词算法在搜索引擎应用中有着广泛的应用空间,且能够增加信息检索的准确性,故而值得予以推广。在此之上,本文简要分析了中文分词算法的作用与中文分词算法在搜索引擎中的难点,并分别从基于字符串匹配分词、基于N元语法分词、基于搜索统计技术等方面,论述了中文分词算法在搜索引擎应用中的运用策略,以此提高大众对中文分词算法的认知水平。  相似文献   

6.
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术。笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象。介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法——正向最大匹配分词算法。该算法是最常见的一种中文分词算法,比较符合人的思维习惯。了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进。  相似文献   

7.
Internet网上资源丰富,搜索引擎更是各领风骚。但是,经常上网的朋友一定深切地感到对于我们中国人而言,用英语进行查询和测览,毕竟不如用中文来得熟练自如。由此引出了两个问题:(1)能不能利用AhaVista搜索引擎查找中文网页?(2)能不能直接利用中文在AhaVista搜索引擎中进行查询?答案是肯定的。至少对于笔者甚为熟悉的AltuVISta来讲,这两点并非难以实现。而且,AhaVista搜索引擎于近日主页更新之际,对原有的中文检索作了进一步的加强,丰富了中文检索的各种手段和功能。如何查找中文Web页面AhaVista搜索引擎允许对查询结果…  相似文献   

8.
巧用黑盒法逆推百度中文分词算法   总被引:1,自引:0,他引:1  
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术.笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象.介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法--正向最大匹配分词算法.该算法是最常见的一种中文分词算法,比较符合人的思维习惯.了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进.  相似文献   

9.
本文对当前的搜索引擎原理进行了简要的分类介绍,概述了中文搜索引擎的特殊性和难点,并给出了两种中文分词算法。  相似文献   

10.
本文对当前的搜索引擎原理进行了简要的分类介绍,概述了中文搜索引擎的特殊性和难点,并给出了两种中文分词算法。  相似文献   

11.
介绍了当前搜索引擎的分类、现状及发展,剖析了搜索引擎采用的核心技术——全文检索与分词技术,提出了MicroFtp新算法和基本原理,并将该算法与其他搜索引擎作了比较。  相似文献   

12.
基于字表的中文搜索引擎分词系统的设计与实现   总被引:9,自引:0,他引:9  
丁承  邵志清 《计算机工程》2001,27(2):191-192,F003
分析了常用的基于词典的汉语分词方法用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引,查询,排除歧义等方面进行了设计和实现。  相似文献   

13.
Internet上有关元搜索引擎的研究与设计   总被引:1,自引:0,他引:1  
概述了Internet上一种新形式——元搜索引擎的概念、构成及分类,对元搜索引擎和一般的搜索引擎进行了比较,联系当前国内外元搜索引擎的现状,分析了其意义,提出了基于Agent的元搜索引擎的设计方案,指出了有自己独特的检索方式和处理方式,突破了传统搜索的局限性,并且该形式尚有许多重要问题亟待解决。  相似文献   

14.
垂直搜索引擎是搜索引擎领域的行业化分工,根据地学信息领域的行业特征、整体需求及其工作流程,在Nutch开源搜索引擎平台上添加了"庖丁解牛"中文分词算法、主题相关度评分算法、"主题词管理"选项等技术,建立了基于网络蜘蛛模型的面向地学信息领域的垂直搜索引擎。经过测试及结果比较,该系统相对于通用搜索引擎有明显的优势,使地学信息的定位和查找更加准确。该系统具有良好的扩展性和通用性,对垂直搜索引擎的研究和开发具有一定的借鉴作用。  相似文献   

15.
Internet的搜索引擎   总被引:18,自引:2,他引:16  
文章对现有的中英文搜索引擎做了分析比较,指出当前搜索引擎存在过分追求大而全以及用户界面不方便表达用户感兴趣的主题的问题,并基于一个用 Java开发的 Internet中文即时搜索工具,提出了一些尝试性的解决方案。  相似文献   

16.
本文通过应用Cranfield体系——构建查询样例集合、查询信息需求分类、抓取搜索引擎结果、规定标注准则、计算性能评价指标的基本流程,对目前常用中文搜索引擎,百度、谷歌、搜狗、搜搜、人民搜索性能从定量的角度,进行较为全面的评价。其结果可供用户在选择、利用这些搜索引擎时参考。  相似文献   

17.
搜索引擎结果聚类算法研究   总被引:6,自引:1,他引:5  
随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找。而对搜索引擎结果聚类能使用户在更高的主题层次上来查看搜索引擎返回的结果。该文提出了搜索引擎结果聚类的几个重要指标并给出了一个新的基于PAT—tree的搜索引擎结果聚类算法。  相似文献   

18.
多元搜索引擎系统的设计与实现   总被引:6,自引:1,他引:5  
由于传统搜索引擎技术的局限性和网络信息的不断增长,从网上获取满足用户需求的信息越来越困难,为此开发了一个在各评价指标方面都优于传统搜索引擎的并行网络信息检索新工具———多元搜索引擎系统。文章详细分析介绍了该系统的组成结构及实现方法。  相似文献   

19.
Using data from the Pew Internet and American Life Project surveys, this article explores changing trends in reported sophistication and satisfaction with search skills and with search engines. We find that the proportion of Internet users searching online for answers to specific questions—as opposed to casual browsing—has grown significantly. Moreover, as users get more experience online, they increasingly become dependent on search engines, confident in their findings, and savvy about how search engines structure information, privilege paid results, and track users. When other factors are controlled, years of online experience is a strong predictor of the likelihood of a person doing specific searches on a daily basis, and experience can have an even stronger positive effect than education and income. We also find that years of online experience, frequency of use, and sophistication with multiple search engines can overcome socio-economic status in predicting how active a person is in searching across different topics.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号