首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
音节切分是整句拼音转换的基础,由于拼音的特殊性,存在歧义切分的可能.如果采用最少分词算法只能得到一种切分结果,不能保证整句拼音转换的正确性.提出一种音节切分算法,通过插入音素节点不断构造合法音节节点,进而生成状态空间,遍历算法遍历状态空间可获得所有的切分可能,而当用户进行删除操作时,只需删除部分相关节点.整个状态空间随用户的操作进行局部凋整,分布均匀.该算法有利于存在歧义切分问题的整句拼音转换,可从保留下来的所有切分可能中选出一个全局最优的语句候选,保证整句转换的正确性.  相似文献   

2.
输入法的实现具有递增解码的特性,因此设计一种存储结构来描述这种特性.随着用户的输入,插入对应的节点来构造整个空间,由遍历算法可无一遗漏的将所有的可能均记录下来,等待后期的处理,而当用户进行删除时,无需重构状态空间,只需删除对应的相关节点.整个空间随用户输入和删除操作不断变化,且变化均匀.该结构空间在手写笔画输入法、整句输入法、歧义音节切分等应用中体现出其描述问题状态空间的清晰性、解决问题的方便性和针对输入法领域的通用性.  相似文献   

3.
基于整句输入法的状态空间模型   总被引:1,自引:0,他引:1       下载免费PDF全文
提出融入Viterbi算法的状态空间模型,成功地描述了整句转换的状态空间,实现了整句输入法。这种模型的插入操作,只需对新增的拼音节点与已输入的拼音节点可能产生的所有字词候选节点进行概率累积计算,链接到状态空间模型中;删除操作,只需直接删除与拼音节点相关的候选字词节点;而当到达用户输入边界,可以依赖右指针域指向尾节点的候选字词节点中累积概率最大者的父指针,通过回溯找到最优语句候选。该状态空间模型比起词网格更易判断前驱和后继,实验证明其对整句输入法实现是有效的。  相似文献   

4.
方言转换系统实现了普通话到济南话、沈阳话和西安话的实时语音转换.北方方言之间的差异主要体现在声调上,声调是属于音节的,因此声调转换模式转换是以音节为单位实施的.主要研究了方言转换系统中关键技术:连续语流音节切分算法.提出了一种基于自动机的逐级音节切分算法,分为语段切分、音节切分自动机和切分点自动校正三部分.该算法在误差48ms时,正确率达到72.55%,并成功支持了方言转换中的基频模式转换.  相似文献   

5.
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以拔出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等,实现汉语歧异切分的方法,通过修改、插入多元信息库中的信息量,进一步设计了一个具有自适应能力的歧义切分方法,并通过实验证明该方法能够有效改进汉语分词中错误歧义切分的结果.  相似文献   

6.
讨论音序输入法中的汉语拼音流,实现当前音序输入法中拼音流的切分算法,包括对含中R/N/G拼音流切分难点的解决.拼音流的切分是整句输入的基础,给出算法具体实现所需的数据结构(汉语拼音的声母表与有效的汉语拼音表和音节树),经验证,该算法成功地实现了对拼音流的自动切分.  相似文献   

7.
为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法。针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法。利用连通域的删除、合并、拆分等操作对文字进行切分。使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作。对于粘连字,采用改进的滴水算法进行有效切分。实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作。该算法的列切分准确率为97.69%,字切分准确率为87.79%。  相似文献   

8.
在基于单元选择的英语语音合成中,音节切分是非常重要的一环。这主要是因为英语词汇的无限性,且存在大量的 多音节词,因而许多情况下,我们不得不从音节的角度来合成语音。为此,本文提出了一种基于约束树的音节切分算法,通过应用 形态规则约束、韵律规则约束及音位规则约束,从而最终切分出所有音节。在实施音位规则约束时,我们提出了一种基于音位结 构树的子算法。训练样本和测试样本的切分正确率分别为99. 13%和98. 55%。  相似文献   

9.
一种面向网络答疑的汉语切分歧义消除算法   总被引:3,自引:0,他引:3  
针对网络答疑的特点,该文提出了一种汉语歧义消除算法,采用回溯机制及歧义消除评优算法相结合的方法消除汉语切分歧义。首先利用回溯机制发现句子的切分歧义字段,产生含有多种可能切分结果的候选集;然后针对网络答疑特点提出了评优算法,利用该算法计算候选结果的评价值,对其进行排序,选取分词最佳结果,从而消除歧义,提高分词的准确率。该算法已经在基于Web的自然语言答疑系统WebAnswerSystem中实现并得到了实际应用。实验结果表明,算法具有较高的准确率和召回率,对自然语言网络答疑中进行切分歧义消除是行之有效的。  相似文献   

10.
现代汉语通用分词系统中歧义切分的实用技术   总被引:8,自引:0,他引:8  
歧义切分技术是中文自动分词系统的关键技术之一·特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词库同时参与切分,这给歧义切分技术提出了更高的实用性要求·从大规模的真实语料库中,考察了歧义(特别是交集型歧义)的分布情况和特征;提出了一种改进的正向最大匹配歧义字段发现算法;并根据GPWS的需求,提出了一种“规则 例外”的实用消歧策略·对1亿字《人民日报》语料(约234MB)中的交集型歧义字段进行了穷尽式的抽取,并随机的对上述策略进行了开放性测试,正确率达99%·  相似文献   

11.
音节是泰语构词和读音的基本单位,泰语音节切分对泰语词法分析、语音合成、语音识别研究具有重要意义。结合泰语音节构成特点,提出基于条件随机场(Conditional Random Fields)的泰语音节切分方法。该方法结合泰语字母类别和字母位置定义特征,采用条件随机场对泰语句子中的字母进行序列标注,实现泰语音节切分。在InterBEST 2009泰语语料的基础上,标注了泰语音节切分语料。针对该语料的实验表明,该方法能有效利用字母类别和字母位置信息实现泰语音节切分,其准确率、召回率和F值分别达到了99.115%、99.284%和99.199%。  相似文献   

12.
基于二叉划分树的多尺度图像分割算法   总被引:1,自引:0,他引:1  
图像分割作为从图像中提取感兴趣对象的必要步骤,通常需要其能够提供多尺度的分割结果.提出一种基于二叉划分树(BPT)的多尺度图像分割算法,用于系统地记录从图像的任意过分割结果上进行的区域合并过程;然后基于BPT中每个结点与其父亲结点的差异度量,提出一种包括自动确定候选结点和分裂合并策略的结点选择算法,来选出符合期望分割区域数目的结点,并生成相应尺度的分割结果.实验结果表明,文中算法能够在较粗分割尺度下获得更适合于对象提取的分割结果,有助于提高自动对象提取的效率以及减少交互式对象提取中的人工交互.  相似文献   

13.
针对JSEG算法在图像分割中出现的明显过分割现象,提出一种基于边缘信息的JSEG[1]改进方法。该方法首先将图像的颜色空间转换为LUV颜色空间,用PGF(Peer Group Filtering)[2]算法对图像进行平滑去噪,用分裂算法确定图像的类数,用GLA(Generalized Lloyd Algorithm)[3]算法完成量化,生成"类图"。然后计算每个像素的J值,并利用Canny算子检测的边缘信息,对J值进行修正,计算每个像素的局部相似程度,并在不同的尺寸下构建J图像,这样就能反映出最有可能的边界位置。最后在J图像上进行种子区域增长,直到获得最终的分割结果。实验结果表明该方法可以有效地改善JSEG算法在图像分割中存在的过分割现象。  相似文献   

14.
基于图像处理的盲道识别算法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种基于图像处理的盲道识别算法。根据采集到的盲道图像,综合利用闻值分割、彩色连续性空间分割、纹理分割,结合直线检测算法,分析各种盲道特征以区分盲道与普通人行道。实验结果表明,该算法能有效分割多数盲道图像,检测出图片中的盲道区域和盲道行进方向,可以自适应选择速度最快且有效的分割方法,适用于实时导盲系统。  相似文献   

15.
以IC芯片彩色图像为研究对象,分析了迭代阈值法,松弛迭代算法,颜色空间聚类算法在此类图像分割中的不足,并改进迭代阈值法,对原始图像进行颜色空间转换,由RGB空间转化到CIE Lab空间;同时利用八叉树算法对图像进行8位量化,对得到的灰度图像进行迭代阈值分割得到最佳阈值,从而提出了专门针对彩色图像背景分割的彩色迭代阙值法.最后基于Visual Studio6.0平台实现上述4种方法,并通过对比实验证明本文所采用的方法的可行性和实用性.  相似文献   

16.
为提高纺织CAD技术,对织物图像的分割进行了研究。依据半监督聚类理论,提出了一种基于HLC颜色空间的以NBS颜色距离为优化准则的半监督聚类的织物图像分割算法。算法利用有限的人工信息,即在织物图像上点击有限的几个点以标识相应区域之间的关系,从而得到满足用户给定限制的织物图像分割结果。算法首先对织物图像进行量化转换处理,而后在HLC色彩空间中集成先验的分割信息进行色彩聚类。实验结果表明,该算法在织物图像分割中是一种可行的方法。  相似文献   

17.
带宽自适应MeanShift图像分割算法   总被引:1,自引:0,他引:1  
MeanShift是目前为止特征空间分析的最好方法之一,但其分割结果受带宽参数的影响。图像粗糙度是与视觉感受相关的图像纹理特征,对图像纹理的描述能力很强。图像像素的平均偏移量也体现了图像像素的总体离散情况。通过对高斯核函数的创建以及图像粗糙度的描述,创新性地给出了MeanShift的窗口尺寸选择方法以及图像像素平均偏移的计算,仿真结果表明,该算法对不同类型的图像,均能得到令人满意的效果。  相似文献   

18.
This work is about intra-sentence segmentation performed before syntactic analysis of long sentences composed of at least 20 words in an English–Korean machine translation system. A long sentence has been known to spend enormous computational time and space when it is analyzed syntactically. It can also produce poor translation results. To resolve this problem, we partitioned a long sentence into a few segments to analyze each segment separately. To partition the sentence, firstly, we tried to find candidates for each segment position in the sentence. We then generated input vectors representing lexical contexts of the corresponding candidates and also used the support vector machines (SVM) algorithm to learn and recognize the appropriate segment positions. We used three kernel functions, the linear kernel, the polynomial kernel and the Gaussian kernel, to find optimal hyperplanes classifying proper positions and we compared results obtained from each kernel function. As a result of the experiments, we acquired 0.81, 0.83, and 0.79 f-measure values from the linear, polynomial and Gaussian kernel, respectively.  相似文献   

19.
基于等周算法的图像分割   总被引:1,自引:0,他引:1       下载免费PDF全文
采用一种基于图论的等周算法对图像的分割进行了研究。首先利用等周算法对静止图像进行分割,并与边缘检测和区域检测的两种分割方法进行结果比较;接着利用等周算法并结合数学形态学处理对图像序列的分割进行了研究。实验结果表明:等周算法不仅可用于静止图像的分割,也可应用于图像序列的分割。基于等周算法可获取更为精确的分割结果,是一种快速的图论分割方法。并且结合形态学处理可对低对比度的目标获取好的分割结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号