共查询到20条相似文献,搜索用时 65 毫秒
1.
中文搜索引擎的原理剖析及开发实现技术 总被引:13,自引:0,他引:13
介绍了当前搜索引擎的分类、现状及中文搜索引擎的发展,剖析了中文搜索引擎采用的核心技术-全文检索与中文分词技术,探讨了编程中应注意的问题和部分实现技术,并对中文搜索引擎的发展提出了几点建议。 相似文献
2.
基于字表的中文搜索引擎分词系统的设计与实现 总被引:9,自引:0,他引:9
分析了常用的基于词典的汉语分词方法用于中文搜索引擎开发中的不足,提出基于字表的中文搜索引擎分词系统,并在索引,查询,排除歧义等方面进行了设计和实现。 相似文献
3.
开发中文搜索引擎汉语处理的关键技术 总被引:24,自引:0,他引:24
论述了开发中文搜索引擎语言方面的两项关键技术,即中文分词技术和汉化问题,介绍了几种解决方案,并在结尾展望了中文搜索引擎的未来。 相似文献
4.
5.
本文介绍了搜索引擎的关键技术——中文分词技术,对中文分词技术的概念、常用算法以及分词的难点进行了详细介绍,让读者对中文分词的现状有所了解。 相似文献
6.
农业搜索引擎中文分词工具对比 总被引:1,自引:0,他引:1
中文分词是中文语言处理技术中最关键的部分,被作为其中最重要的预处理手段广泛应用.本文主要分析和比较了ASPSeek、ICTCLAS、Paoding、MMseg、IK与JE六种分词工具对农业搜索引擎的影响.结果表明:在农业搜索引擎的应用效果中,分词准确性最优的是ICTCLAS分词工具,而F1测度最高的是JE分词工具. 相似文献
7.
8.
李文华 《数字社区&智能家居》2021,(6):181-182,185
中文分词算法在搜索引擎应用中有着广泛的应用空间,且能够增加信息检索的准确性,故而值得予以推广.在此之上,本文简要分析了中文分词算法的作用与中文分词算法在搜索引擎中的难点,并分别从基于字符串匹配分词、基于N元语法分词、基于搜索统计技术等方面,论述了中文分词算法在搜索引擎应用中的运用策略,以此提高大众对中文分词算法的认知水... 相似文献
9.
随着我国科学技术的进步,网络信息化的快速发展,搜索引擎成为了人们查找数据的最主要工具。在搜索引擎中,为了提高用户查找所需要数据信息的准确性和全面性,可以使用中文分词技术,中文分词技术在中文搜索引擎中占据了重要的地位。用户在使用中文分词技术对中文搜索引擎的查准率及查全率有着深刻的影响。 相似文献
10.
基于全文搜索的中文搜索引擎设计技术 总被引:6,自引:0,他引:6
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。 相似文献
11.
12.
一、动机及分析自从电子计算机发明之后 ,帮助我们解决许多问题 ,也证明在科技的领域上跨进了一大步 ,但供不应求 ,人类很快地体会到计算机还缺乏智能 ,以及缺乏解决复杂问题的能力 ,因而引起研究人员对研究人工智能的极度兴趣 ,其中重要的一项课题即是如何使电子计算机让人类得到高度的有效运用。196 0年以后 ,我们不断的在这方面改进和创新 ,经过四十多年漫长研究“人工智能”,投资了大量的研究经费 ,可惜成果并不尽人意 ,评论家和资本家对这方面的成就都感到颇为失望。四十多年过去了 ,人类对于富有人工智能的电子计算机 ,仍然是遥遥无期… 相似文献
13.
14.
Sun Yufang 《计算机科学技术学报》1991,6(4):370-375
To facilitate the wider use of computers all over the world,it is necessary to provide National Language Support in the computer systems.This paper introduces some aspects of design and implementation of the UNIX-based Chinese Information Processing Systems (CIPS). Due to the special nature of the Oriental languages,and in order to be able to share resources and exchange in formation between different countries,it is necessary to create a standard of multilingual information exchange code.The unified Chinese/Japanese/Korean character code,Han Character Collection(HCC),was proposed to ISO/IEC JTC1/SC2/WG2 by China Computer and Information Processing Standardization Technical Committee.Based on this character set and the corresponding coding system,it is possible to create a true Internationalized UNIX System. 相似文献
15.
Smalltalk是最具有代表性的面向对象的程序设计语言及环境。本文给出了在其中实现汉字信息处理的一种方法。此方法不是对原系统进行汉化,而是针对Smalltalk的完成输入,输出及编辑功能的类程设置相应的汉字处理类程,使用户不但能在各窗口中处理汉字信息,而且也能在程序中输出汉字。文中首先分析了Smalltalk的字符显示原理及窗口技术,然后详述了各汉字类程的设计思想和实现方法。 相似文献
16.
合成孔径雷达干涉测量(INSAR)因具有全天时、全天候和高精度的特点而被广泛应用于地学、海洋、资源探测以及灾害监测等众多领域,但仍有若干理论和技术问题还没有得到彻底解决而限制了该项技术的大规模实际应用。本在简要介绍INSAR原理的基础上,重点讨论数据处理中的关键技术,特别着重分析了影响INSAR测量精度的主要环节,包括当前影像匹配、去平地效应、干涉条纹图滤波以及相位解缠中所存在的问题,并给出部分处理实例供学讨论。 相似文献
17.
18.
以模糊数据与ERP的融合应用为背景,探讨了关系数据库上模糊数据库表的设计及相关的数据处理技术.与先前所提出的对预先确定的模糊子集直接"保存-提取"的方式不同,通过一个实例--"剩余库存消耗天数预测"展示了一种以灵活的模糊查询为目标,"在查询时构建模糊集"的模糊数据库表设计.在所提出的数据库表中可减少对应于各预设模糊集的冗余记录.结合所提出的数据库表,探讨了模糊数据的归一化、排序、查询等处理方法与技术. 相似文献
19.
20.
无线多媒体传感器网络广阔的应用前景使其得到了广泛的研究,但针对WMSNs的多媒体信息处理技术的研究还较少,本文对已有的各种处理技术进行了总结,并探讨了基于内容识别的自适应传输技术在WMSNs应用的可行性,以促进在该领域内的研究深入展开. 相似文献