共查询到10条相似文献,搜索用时 15 毫秒
1.
2.
输入法的实现具有递增解码的特性,因此设计一种存储结构来描述这种特性.随着用户的输入,插入对应的节点来构造整个空间,由遍历算法可无一遗漏的将所有的可能均记录下来,等待后期的处理,而当用户进行删除时,无需重构状态空间,只需删除对应的相关节点.整个空间随用户输入和删除操作不断变化,且变化均匀.该结构空间在手写笔画输入法、整句输入法、歧义音节切分等应用中体现出其描述问题状态空间的清晰性、解决问题的方便性和针对输入法领域的通用性. 相似文献
3.
提出融入Viterbi算法的状态空间模型,成功地描述了整句转换的状态空间,实现了整句输入法。这种模型的插入操作,只需对新增的拼音节点与已输入的拼音节点可能产生的所有字词候选节点进行概率累积计算,链接到状态空间模型中;删除操作,只需直接删除与拼音节点相关的候选字词节点;而当到达用户输入边界,可以依赖右指针域指向尾节点的候选字词节点中累积概率最大者的父指针,通过回溯找到最优语句候选。该状态空间模型比起词网格更易判断前驱和后继,实验证明其对整句输入法实现是有效的。 相似文献
4.
方言转换系统实现了普通话到济南话、沈阳话和西安话的实时语音转换.北方方言之间的差异主要体现在声调上,声调是属于音节的,因此声调转换模式转换是以音节为单位实施的.主要研究了方言转换系统中关键技术:连续语流音节切分算法.提出了一种基于自动机的逐级音节切分算法,分为语段切分、音节切分自动机和切分点自动校正三部分.该算法在误差48ms时,正确率达到72.55%,并成功支持了方言转换中的基频模式转换. 相似文献
5.
6.
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以拔出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等,实现汉语歧异切分的方法,通过修改、插入多元信息库中的信息量,进一步设计了一个具有自适应能力的歧义切分方法,并通过实验证明该方法能够有效改进汉语分词中错误歧义切分的结果. 相似文献
7.
为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法。针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法。利用连通域的删除、合并、拆分等操作对文字进行切分。使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作。对于粘连字,采用改进的滴水算法进行有效切分。实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作。该算法的列切分准确率为97.69%,字切分准确率为87.79%。 相似文献
8.
9.
连续汉语语音识别中基于归并的音节切分自动机 总被引:4,自引:0,他引:4
文章研究并实现了汉语连续语音中的音节自动切分算法——基于归并的音节切分自动机(merging-based syllable detection automaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参数高度相似的相邻帧(1帧或若干帧)的语音信号进行“归并(merging)”,形成“归并类似段(merged similar segment,简称MSS)”,它们被认定属于同一音节的相同状态.这些MSS经过一个包含若干状态的“音节切分自动机( 相似文献
10.
一种面向网络答疑的汉语切分歧义消除算法 总被引:3,自引:0,他引:3
针对网络答疑的特点,该文提出了一种汉语歧义消除算法,采用回溯机制及歧义消除评优算法相结合的方法消除汉语切分歧义。首先利用回溯机制发现句子的切分歧义字段,产生含有多种可能切分结果的候选集;然后针对网络答疑特点提出了评优算法,利用该算法计算候选结果的评价值,对其进行排序,选取分词最佳结果,从而消除歧义,提高分词的准确率。该算法已经在基于Web的自然语言答疑系统WebAnswerSystem中实现并得到了实际应用。实验结果表明,算法具有较高的准确率和召回率,对自然语言网络答疑中进行切分歧义消除是行之有效的。 相似文献