首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 59 毫秒
1.
农业搜索引擎中文分词工具对比   总被引:1,自引:0,他引:1  
中文分词是中文语言处理技术中最关键的部分,被作为其中最重要的预处理手段广泛应用.本文主要分析和比较了ASPSeek、ICTCLAS、Paoding、MMseg、IK与JE六种分词工具对农业搜索引擎的影响.结果表明:在农业搜索引擎的应用效果中,分词准确性最优的是ICTCLAS分词工具,而F1测度最高的是JE分词工具.  相似文献   

2.
本文提出了电子商务行业搜索引擎的概念,通过对通用搜索引擎技术进行分析,结合电子商务行业对搜索引擎的需求提出需要改进的部分,并设计出一个电子商务行业搜索引擎整体结构;此外,讨论了几种搜索引擎的中文分词算法,结合电子商务行业的特点对分词算法进行了改进,提出一种适用于电子商务行业搜索应用的全新分词系统。最后,结合整体结构与分词系统并利用已有的网络开源项目,实现了一个电子商务行业搜索引擎。  相似文献   

3.
张敏 《福建电脑》2010,26(6):102-102,122
本文通过对垂直搜索引擎的工作原理与主要技术进行分析,给出了一种基于开源Nutch上实现中文垂直搜索引擎的方案。  相似文献   

4.
针对目前最常用的分词算法——最大匹配算法效率低,长度受限等缺点,在对中文编码体系和中文分词的算法进行研究的基础上,提出了一种新的词库数据结构。它支持首字Hash和标准二分查找,而且不限制词条的长度。然后介绍了基于该词库设计的一种快速的分词算法,并给出了算法的实现过程。  相似文献   

5.
面向搜索引擎Lucene的中文分析器   总被引:1,自引:0,他引:1       下载免费PDF全文
针对目前应用于搜索引擎Lucene的中文分析器的分词不符合汉语习惯的现状,根据正向最大匹配切分算法和采用包括基本标准中文词语的词库,实现了自己的分析器。该分析器的分词结果更符合汉语的习惯,并且在分词、建立索引等方面的性能非常接近基于机械分词的分析器,另外在检索速度方面性能提升了2~4倍,在检索召回率方面性能提升了59%。  相似文献   

6.
中文分词算法在搜索引擎应用中的研究   总被引:14,自引:1,他引:14  
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。  相似文献   

7.
中文分词算法在搜索引擎应用中有着广泛的应用空间,且能够增加信息检索的准确性,故而值得予以推广.在此之上,本文简要分析了中文分词算法的作用与中文分词算法在搜索引擎中的难点,并分别从基于字符串匹配分词、基于N元语法分词、基于搜索统计技术等方面,论述了中文分词算法在搜索引擎应用中的运用策略,以此提高大众对中文分词算法的认知水...  相似文献   

8.
基于Nutch的中文搜索引擎的研究与实现   总被引:1,自引:0,他引:1  
重点讨论了搜索引擎原理及基于Nutch的搜索引擎的实现架构,同时对网页抓取过程作了深入的研究和分析。最后,给出了基于Nutch的中文搜索引擎的解决方案。  相似文献   

9.
从中英文用户的搜索习惯差异的角度出发,引入中文分词技术对中文搜索引擎的搜索日志进行了分析。重点分析了用户输入搜索词的一些规律,包括选择的语言、搜索词的长度和频率、高级搜索技巧的使用以及搜索词的修改情况;还提出了用户提交搜索词的模型,给出了历史搜索词对搜索结果的影响因子算法。  相似文献   

10.
中文搜索引擎现状与展望   总被引:19,自引:0,他引:19  
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。  相似文献   

11.
搜索引擎是获取网络信息的重要手段,本文通过对搜索引擎的现状、使用情况的调查研究,分析了搜索引擎的不足,并对搜索引擎的未来发展进行了简单的介绍.  相似文献   

12.
搜索引擎是获取网络信息的重要手段,本文通过对搜索引擎的现状、使用情况的调查研究,分析了搜索引擎的不足,并对搜索引擎的未来发展进行了简单的介绍。  相似文献   

13.
目前站内搜索已成为Web应用领域的一个热点课题。本文在对站内搜索技术进行分析比较的基础上,根据Sphinx系统结构和运行机制的特点提出了一种可通用的基于Sphinx构建Web站内搜索引擎的方法。该方法对于利用LAMP技术构建的网站,不用修改它的原有架构而能便捷地生成一个性能优越的站内搜索引擎。  相似文献   

14.
中文搜索引擎的原理剖析及开发实现技术   总被引:13,自引:0,他引:13  
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展,剖析了中文搜索引擎采用的核心技术-全文检索与中文分词技术,探讨了编程中应注意的问题和部分实现技术,并对中文搜索引擎的发展提出了几点建议。  相似文献   

15.
搜索引擎优化的作弊与防范   总被引:1,自引:0,他引:1  
随着信息技术的飞速发展,人们越来越多的通过搜索引擎获取信息。快速增长的互联网信息在提供丰富的资源的同时也催生了大量的搜索引擎作弊的行为。本文先是通过对搜索引擎优化的作弊手段进行分析进而提出防范作弊的几种方法。  相似文献   

16.
本文首先介绍了传统搜索引擎的基本原理及结构,指出了传统搜索引擎存在的不足,然后介绍了元搜索引擎的定义、运作机制及其发展的方向,在此理论的基础上提出了新一代元搜索引擎基于用户的调度改进理念,实验表明,该改进提高了用户的检索效率和质量。  相似文献   

17.
闵高照  邵志清 《计算机工程》2005,31(16):124-126
随着搜索引擎应用的日益广泛,如何减少用户的查询响应时间和减轻网络的负载已成为一个重要的研究课题。该文提出了一种建立用户查询结果缓存的策略,并对其相关结构、更新方法、置换策略进行了论述。  相似文献   

18.
网上信息搜索技术与搜索引擎   总被引:6,自引:1,他引:6  
随着Internet在全球范围内的迅速兴起,面对纷繁复杂的Web空间,如何在浩翰如海的信息空间里快速找到并取得所需的信息,便成为人们所关注的主要问题。搜索引擎的出现,极大地方便了Internet用户,使快速有效地获取信息成为可能。目前网上搜索引擎各种各样,有Yahoo!、Excite、AltaVista、Lycos、Infoseek、OpenText、WebCrawler、WWW Worm等几十种。  相似文献   

19.
中国互联网用户群每年网民数量的飞速增多,网购人数的快速增加,搜索引擎正日益成为人们网络生活中的重要组成部分,而搜索引擎营销则成为被各企业比较认可的网站推广手段之一,也成为网络营销服务商最主要的服务项目。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号