期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘政怡 ;吴建国 ;刘慧婷《微机发展》2008,(8):35-38

音节切分是整句拼音转换的基础,由于拼音的特殊性,存在歧义切分的可能。如果采用最少分词算法只能得到一种切分结果,不能保证整句拼音转换的正确性。提出一种音节切分算法,通过插入音素节点不断构造合法音节节点,进而生成状态空间,遍历算法遍历状态空间可获得所有的切分可能,而当用户进行删除操作时,只需删除部分相关节点。整个状态空间随用户的操作进行局部调整,分布均匀。该算法有利于存在歧义切分问题的整句拼音转换,可从保留下来的所有切分可能中选出一个全局最优的语句候选,保证整句转换的正确性。相似文献

2.

基于输入法的通用存储结构

刘政怡樊庆林吴建国李炜《计算机工程与设计》2008,29(17)

输入法的实现具有递增解码的特性,因此设计一种存储结构来描述这种特性.随着用户的输入,插入对应的节点来构造整个空间,由遍历算法可无一遗漏的将所有的可能均记录下来,等待后期的处理,而当用户进行删除时,无需重构状态空间,只需删除对应的相关节点.整个空间随用户输入和删除操作不断变化,且变化均匀.该结构空间在手写笔画输入法、整句输入法、歧义音节切分等应用中体现出其描述问题状态空间的清晰性、解决问题的方便性和针对输入法领域的通用性. 相似文献

3.

基于整句输入法的状态空间模型 总被引：1，自引：0，他引：1

下载免费PDF全文

刘政怡吴建国李炜《计算机工程与应用》2008,44(30):153-156

提出融入Viterbi算法的状态空间模型,成功地描述了整句转换的状态空间,实现了整句输入法。这种模型的插入操作,只需对新增的拼音节点与已输入的拼音节点可能产生的所有字词候选节点进行概率累积计算,链接到状态空间模型中;删除操作,只需直接删除与拼音节点相关的候选字词节点;而当到达用户输入边界,可以依赖右指针域指向尾节点的候选字词节点中累积概率最大者的父指针,通过回溯找到最优语句候选。该状态空间模型比起词网格更易判断前驱和后继,实验证明其对整句输入法实现是有效的。相似文献

4.

方言转换系统中的音节切分算法研究

张帅贾珈杨大利徐明星蔡莲红《计算机技术与发展》2009,19(7)

方言转换系统实现了普通话到济南话、沈阳话和西安话的实时语音转换.北方方言之间的差异主要体现在声调上,声调是属于音节的,因此声调转换模式转换是以音节为单位实施的.主要研究了方言转换系统中关键技术:连续语流音节切分算法.提出了一种基于自动机的逐级音节切分算法,分为语段切分、音节切分自动机和切分点自动校正三部分.该算法在误差48ms时,正确率达到72.55%,并成功支持了方言转换中的基频模式转换. 相似文献

5.

汉语拼音输入法中拼音流的切分

李炜贾庆成刘政怡《现代计算机》2007,(8):11-13

讨论音序输入法中的汉语拼音流,实现当前音序输入法中拼音流的切分算法,包括对含中R/N/G拼音流切分难点的解决.拼音流的切分是整句输入的基础,给出算法具体实现所需的数据结构(汉语拼音的声母表与有效的汉语拼音表和音节树),经验证,该算法成功地实现了对拼音流的自动切分. 相似文献

6.

一种基于多元信息库的自适应汉语歧义切分方法

朱巧明温滔李培蜂钱培德《小型微型计算机系统》2006,27(8):1597-1600

在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以拔出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等，实现汉语歧异切分的方法，通过修改、插入多元信息库中的信息量，进一步设计了一个具有自适应能力的歧义切分方法，并通过实验证明该方法能够有效改进汉语分词中错误歧义切分的结果．相似文献

7.

现代汉语通用分词系统中歧义切分的实用技术 总被引：8，自引：0，他引：8

罗智勇宋柔《计算机研究与发展》2006,43(6):1122-1128

歧义切分技术是中文自动分词系统的关键技术之一.特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词库同时参与切分,这给歧义切分技术提出了更高的实用性要求.从大规模的真实语料库中,考察了歧义(特别是交集型歧义)的分布情况和特征;提出了一种改进的正向最大匹配歧义字段发现算法;并根据GPWS的需求,提出了一种“规则+例外”的实用消歧策略.对1亿字《人民日报》语料(约234MB)中的交集型歧义字段进行了穷尽式的抽取,并随机的对上述策略进行了开放性测试,正确率达99%. 相似文献

8.

朝汉混排古籍的文字切分方法

下载免费PDF全文

刘星辰金小峰《计算机工程与应用》2020,56(11):135-141

为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法。针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法。利用连通域的删除、合并、拆分等操作对文字进行切分。使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作。对于粘连字,采用改进的滴水算法进行有效切分。实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作。该算法的列切分准确率为97.69%,字切分准确率为87.79%。相似文献

9.

英语语音合成中基于约束树的音节切分算法

王永生柴佩琪曾令平《微型电脑应用》2005,21(11):15-20

在基于单元选择的英语语音合成中，音节切分是非常重要的一环。这主要是因为英语词汇的无限性，且存在大量的多音节词，因而许多情况下，我们不得不从音节的角度来合成语音。为此，本文提出了一种基于约束树的音节切分算法，通过应用形态规则约束、韵律规则约束及音位规则约束，从而最终切分出所有音节。在实施音位规则约束时，我们提出了一种基于音位结构树的子算法。训练样本和测试样本的切分正确率分别为99． 13%和98． 55%。相似文献

10.

连续汉语语音识别中基于归并的音节切分自动机 总被引：4，自引：0，他引：4

张继勇郑方杜术宋战江徐明星《软件学报》1999,10(11):1212-1215

文章研究并实现了汉语连续语音中的音节自动切分算法——基于归并的音节切分自动机(merging-based syllable detection automaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参数高度相似的相邻帧(1帧或若干帧)的语音信号进行“归并(merging)”,形成“归并类似段(merged similar segment,简称MSS)”,它们被认定属于同一音节的相同状态.这些MSS经过一个包含若干状态的“音节切分自动机( 相似文献