首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
汉语分词技术综述   总被引:15,自引:0,他引:15  
分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,提出了把神经网络和专家系统结合起来建立集成式汉语自动分词系统的构想。  相似文献   

2.
介绍了一个比较不同中文分词算法在分词上异同的软件,特别是在歧义词条切分上的异同之处,它包括了容纳各种分词算法的框架结构及其设计,人工干预歧义切分的界面和显示不同分词方法切分统计结果等功能;通过测试统计,本软件基本可以比较出不同的分词方法在歧义切分上的优劣异同之处。  相似文献   

3.
无监督的动态分词方法   总被引:2,自引:0,他引:2  
介绍了一种变长汉语语料自动分词方法,这种方法以信息理论中极限熵的概念为基础,运用汉字字串间最大似然度的概念,对汉语语料进行自动分词。讨论了这些方法的局限性,并列出了一些试验结果。  相似文献   

4.
智能答疑系统的中文分词   总被引:2,自引:0,他引:2  
对词库进行改造的基础上,提出了一种改进的匹配算法,突破了最大匹配分词算法分词的长度限制,提高了中文分词的速度和效率.  相似文献   

5.
本文提出了一种基于汉语语法知识的汉语拼音自动分词的方法。文章描述了自动分词时,多义切分检测与处理策略,以及利用语法和语义知识实现多义切分纠错方法。本文方法已经在拼音汉字转换系统中应用。实际情况表明,本文提出的汉语拼音自动分词方法是可行的。  相似文献   

6.
通过研究和分析现有最大匹配分词算法,词库结构的设计和分词算法直接关系着分词的速度和效率,提出了一种改进的最大匹配分词算法——基于双字词的动态最大匹配分词算法,设计并实现了汉语分词词库和算法。实验结果表明,此算法相对于现有最大匹配分词算法有显著提高。  相似文献   

7.
目前,采用神经网络来进行分词的方法已有出现。在实现BP网络分词的基础上采用BP网络与改进的遗传算法相结合的方法对已有的方法进行改进,网络容易陷入局部极小的问题得到了较好的解决,收敛速度得到了提高,分词效果得到了很大的改善。  相似文献   

8.
基于字、词、词组的中文搜索引擎分词系统   总被引:2,自引:0,他引:2  
分析了全文检索系统中常用的基于字表和基于词表的中文分词方法的优缺点,提出了基于字、词、词组混合模型的中文搜索引擎分词系统;并利用广义语词概念,设计了分词词典,改进了最大匹配分词算法(MM);最后把分词系统应用于全文检索中。  相似文献   

9.
汉语自动分词是中文信息处理的前提,如何提高分词效率是中文信息处理技术面临的一个主要问题。基于词典和基于统计的分词方法是现有分词技术的主要方法,但是前者无法处理歧义字段,后者需要大量的词频计算耗费时间。本文提出优化最大匹配与统计结合的分词方法,首先提出优化最大匹配算法,在此基础上提出了规则判断与信息量统计两种消歧策略。然后,给出了优化最大匹配与统计结合的分词算法,提高了分词的效率。最后,基于分词算法实现中文分词系统,并通过实验对算法进行了分析和验证。  相似文献   

10.
Aho-Corasick自动机算法是著名的多模式串匹配算法,它在模式串失配时,通过fail指针转移至有效的后续状态,存在一个或多个有效的后续状态可能。据此特性,该文提出了一种适应于中文分词的自动机算法。该算法使用动态规划的方法,计算上下文匹配概率,转移至最佳的有效后续状态,即实现了基于字符串匹配的机械分词方法与基于统计概率模型的方法结合。实验结果表明,该算法分词准确率高。  相似文献   

11.
针对在水表图像中对指针进行分割提取这一问题,提出了一种基于面积和结构特征的水表图像二步分割方法;介绍了该分割方法的思路和分割过程;详细阐述了构成该分割方法的基于结构和灰度特征的哈夫变换分割算法和基于面积特征的阈值分割算法。通过实例,给出了采用该分割方法对水表图像进行分割的效果。  相似文献   

12.
提出一种基于分水岭和种子区域生长的彩色图像改进分割算法。该算法先对彩色图像进行分割前预处理,使用分水岭算法对图像进行初始分割,然后根据一定的规则从分水岭算法分割形成的区域中自动选取种子区域并进行生长,最后合并相似区域或小区域。以区域作为种子生长单位,使用种子区域一次性生长方法进行生长。实验结果表明,该算法分割结果较好,分割速度较快。  相似文献   

13.
提出了一种基于边缘检测的时空视频对象分割算法。首先提出一种基于高阶统计量的帧间差分图像处理方法,然后运用边缘检测得到空域分割结果和用累计差分与对称差分得到时域分割结果,综合时空域分割结果得到运动目标的边缘,最后对边缘图进行区域填充与数学形态学处理,得到运动目标掩模图像。实验结果表明本文算法能够得到较准确的分割结果。  相似文献   

14.
图像分割的分级性研究   总被引:2,自引:0,他引:2  
图像分割是指将一幅图像分解为若干互不交选区域的集合,是图像处理与机器视觉的基本问题之一.本文对传统的分割定义进行分析,指出其局限性,并提出了新的广义定义;根据不同的分割目的,提出了“4级分割”的分级性框架;并简要介绍了各级分割的应用和常用算法.该成果有利于进一步对各种分割算法进行有效的客观评价.  相似文献   

15.
针对受到光照不均匀影响的图片在直接进行阈值分割造成的错分割问题,提出在分割前对图像进行光照补偿的预处理,从原图中分离出光照不均匀平面矩阵,从而降低光照不均匀对阈值分割造成的不利影响。在分割过程中采用模糊聚类算法,提高了图像分割的有效性。  相似文献   

16.
航空图像中基于DSM的多尺度树冠分割   总被引:2,自引:0,他引:2  
提出了一种基于数字表面高程模型(DSM)和多尺度权聚类图像分割的算法。首先通过DSM选择需要分割的候选树冠顶点,利用航空摄影测量的方法将树冠顶点投影到航空相片作为种子点;然后对树冠进行分割,其方法是在一个全局分割测度的约束下,利用代数多网格的数值计算方法,逐步进行权聚类,形成多尺度的分割图像,通过不同的选权参数,获得有意义的分割区域,从多尺度的分割图像中,根据种子点所在位置和分割图像大小确定分割的树冠。经过实际图像验证,此算法能对不同角度投影的树冠进行有效分割。  相似文献   

17.
字符分割是船舶身份识别系统中的关键步骤,提出了一种船铭牌字符分割方法.该方法首先进行图像增强、灰度化和二值化等图像预处理操作,采用了一种基于Hough变换和K均值聚类直线拟合算法校正倾斜变形的牌照图像,然后在分析船铭牌字符特点的基础上,采用一种快速的模版匹配结合垂直与水平投影法对船铭牌上的单个字符进行分割,提高了字符分割的速度和精度.实验结果表明,该方法能够对船铭牌字符进行准确分割,具有良好的鲁棒性和实用性.  相似文献   

18.
基于测地形态学进行细胞 图象分割的新方法   总被引:1,自引:0,他引:1       下载免费PDF全文
细胞分割提取在计算机病理诊断系统中是一个重要技术,分割结果的优劣直接影响着诊断的效果,也是影响诊断系统能否应用在临床上的一个重要因素。本文使用数学形态学的测地形态学方法,利用细胞图象的灰度图特征,提出一种有效的细胞图象分割方法,对原始图象进行中值滤波预处理后,首先使用水浸分割算法得到单个细胞的分割结果和聚堆细胞的外轮廓,然后使用水线分割算法得到水线图,最后通过寻找细胞外轮廓的凹点,结合水线图,实现了聚堆细胞的分离。实验结果表明方法准确可靠,具有一定的通用性。  相似文献   

19.
应用计盒维数方法的路面裂缝图像分割   总被引:3,自引:0,他引:3  
提出利用分形维数分割公路路面裂缝的方法.在差分计盒方法计算图像分形维数的基础上,提出差分计盒方法的改进算法.改进的差分计盒方法被应用到计算路面图像的分形维数上,其分割结果与Sobel算子进行比较.结果显示差分计盒方法可以将路面图像转换成另一种图像,该图像的分形维数可以把简单的阈值应用到路面裂缝的分割.  相似文献   

20.
图像分割是图像处理和计算机视觉中一个关键步骤,也是图像理解的基础。近年来由于其在图像处理领域的应用价值,开始作为一个重要的课题受到研究者的重视。该文从传统和新型角度出发,整理和分析了大量的研究文献,系统的介绍了图像分割的各种理论基础及其应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号