首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
中文搜索引擎的原理剖析及开发实现技术   总被引:13,自引:0,他引:13  
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展,剖析了中文搜索引擎采用的核心技术-全文检索与中文分词技术,探讨了编程中应注意的问题和部分实现技术,并对中文搜索引擎的发展提出了几点建议。  相似文献   

2.
中文搜索引擎中的中文信息处理技术   总被引:24,自引:0,他引:24  
就中文搜索引擎中的若干中文信息处理技术作了较深入地探讨,对诸如中文分词、中文码制转换和中文全半解处理等方面提出了较完整的解决方案。  相似文献   

3.
中文软件需要具有对中文文本的输入、显示、编辑、输出等基本功能,而且随着计算机技术的发展,对于计算机的文本处理能力提出了更高的要求,并且所有这些中文处理功能都要建立在对汉语文本的分词处理这一基本功能之上。因而,汉语分词是中文信息处理的基础,在中文信息处理系统中具有广泛的应用前景。  相似文献   

4.
基于字表的中文搜索引擎分词系统的设计与实现   总被引:9,自引:0,他引:9  
丁承  邵志清 《计算机工程》2001,27(2):191-192,F003
分析了常用的基于词典的汉语分词方法用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引,查询,排除歧义等方面进行了设计和实现。  相似文献   

5.
中文姓名的自动辨识   总被引:48,自引:16,他引:32  
中文姓名的辨识对汉语自动分词研究具有重要意义。本文提出了一种在中文文本中自动辨识中文姓名的算法。我们从新华通讯社新闻语料库中随机抽取了300个包含中文姓名的句子作为测试样本。实验结果表明, 召回率达到了99.77%。  相似文献   

6.
本文介绍了搜索引擎的关键技术——中文分词技术,对中文分词技术的概念、常用算法以及分词的难点进行了详细介绍,让读者对中文分词的现状有所了解。  相似文献   

7.
基于多功能逻辑运算分析技术的汉语分词   总被引:3,自引:0,他引:3  
文中提出了一种基于多功能运算分析技术的汉语自动分词方法,其特点是在汉语词语字序列的计算机内部表示上采用多功能逻辑运算表达式方式,从而使汉语分词过程中以往有用的简单模式比较匹配转换为多模式逻辑运算下的功能操作。  相似文献   

8.
汉语自动分词方法   总被引:26,自引:0,他引:26       下载免费PDF全文
本文给出了为汉语自动分词而提出了机械匹配法,特征词库法,约束矩法,语法2分析法和理解切法。  相似文献   

9.
本文阐述了自动分词技术的理论与技术创新点,提出了一个适用于中英文WWW搜索引擎的分词器的实现,它具有高速的特点,同时具有较好的切分精度。该分词技术能对外提供基于全文和关键字检索的接口,并采用一系列的策略来提高切分速度,优化结构。它已应用于“中英文WWW搜索引擎系统”中,应用效果较好。  相似文献   

10.
设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种组合型的分词方法能够较好地解决中文歧义并发现新的登录词。  相似文献   

11.
Internet的搜索引擎   总被引:16,自引:2,他引:16  
文章对现有的中英文搜索引擎做了分析比较,指出当前搜索引擎存在过分追求大而全以及用户界面不方便表达用户感兴趣的主题的问题,并基于一个用 Java开发的 Internet中文即时搜索工具,提出了一些尝试性的解决方案。  相似文献   

12.
搜索引擎的现状及分析   总被引:8,自引:0,他引:8  
在介绍了搜索引擎的工作原理、一般概念及分类后,较为详细地分析了目前搜索引擎存在的问题和发展趋势,提出了搜索引擎当前的主要研究内容。  相似文献   

13.
针对目前图书馆的各种电子资源都需要在各自的平台上单独检索的问题,提出构建基于搜索引擎的一站式检索平台,实现在统一的检索界面上,一次检索就能获得所有电子资源的相关文献信息,使读者能在最短的时间内获得最深入、最准确、最全面的文献信息。  相似文献   

14.
搜索引擎是网络中一种必不可少的工具,如何合理地提供网站在搜索引擎中排名成为目前的热点话题。在分析google可能的网站评价策略基础上,提出了一套网站优化方案,并对“高等数学精品课程”网站进行了优化改进,取得令人满意的效果。  相似文献   

15.
信息挖掘的关键技术就是如何将用户所需的关键词与数据库、网络中的关键词进行匹配并进行筛选和甄别。为了完成此过程,人们利用爬虫技术,对网络信息进行搜索、获取、暂存、分析,并形成最终的搜索结果。在此过程中Java所形成的搜索引擎技术起到了较好的应用效果。  相似文献   

16.
针对目前最常用的分词算法——最大匹配算法效率低,长度受限等缺点,在对中文编码体系和中文分词的算法进行研究的基础上,提出了一种新的词库数据结构。它支持首字Hash和标准二分查找,而且不限制词条的长度。然后介绍了基于该词库设计的一种快速的分词算法,并给出了算法的实现过程。  相似文献   

17.
本文首先介绍了传统搜索引擎的基本原理及结构,指出了传统搜索引擎存在的不足,然后介绍了元搜索引擎的定义、运作机制及其发展的方向,在此理论的基础上提出了新一代元搜索引擎基于用户的调度改进理念,实验表明,该改进提高了用户的检索效率和质量。  相似文献   

18.
随着因特网的迅猛发展,搜索引擎也在不断地发展。本文在分析传统搜索引擎弊端后,指出了搜索引擎发展的趋势:跨语言搜索引擎、多媒体搜索引擎、智能搜索引擎和基于智能代理技术的搜索引擎。最后,简要地给出了搜索引擎发展趋势所表现出的特点。  相似文献   

19.
随着因特网的迅猛发展,搜索引擎也在不断地发展.本文在分析传统搜索引擎弊端后,指出了搜索引擎发展的趋势:跨语言搜索引擎、多媒体搜索引擎、智能搜索引擎和基于智能代理技术的搜索引擎.最后,简要地给出了搜索引擎发展趋势所表现出的特点.  相似文献   

20.
垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。该文结合使用Heritrix与Lucene对学校新闻网站网页进行抓取并建立索引,建立相对应的新闻垂直搜索引擎系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号