排序方式: 共有25条查询结果,搜索用时 15 毫秒
1.
多音字消歧是普通话语音合成系统中字音转换模块的核心问题。选择了常见易错的33个多音字和24个多音词作为研究对象,构建了一个平均每个多音字(词)5 000句的语料库,并且提出了一种结合决策树和基于转换的错误驱动的学习(Transformation- Based error-driven Learning,TBL)的混合算法。该方法根据决策树的指导,自动生成TBL算法的模板,避免了手工总结模板这一费时费力的过程。实验结果表明,该方法生成的模板与手工模板性能相当,其平均准确率达90.36%,明显优于决策树。 相似文献
2.
郑斌 《浙江纺织服装职业技术学院学报》2009,8(3):62-65
介绍了拼音检索的原理.给出了同时支持中文全拼,首字母简拼以及多音字检索的数据库字段设计方案.通过一个支持拼音检索的WEB查询系统的具体实例,论述了如何运用AJAX来加快WEB查询系统的反应时间,构建一个友好的查询系统. 相似文献
3.
4.
“朗读”项是普通话水平测试的重要内容。在有文字凭借的测试项中,“朗读”项所占分数的比例最大,达到30%。本文从把握多音字读音、掌握语流音变、控制语速三个方面对该项进行了深入的探讨。 相似文献
5.
6.
经过对最大熵模型的研究,找到一种适合汉语拼音标注的最大熵模型算法.利用该算法解决了多音字单字成词的情况,从而使得所有包含多音字的词都是两字或多字词.使用该算法随机抽取"读者文摘"中的一篇文章进行标注实验,实验表明拼音标注正确率达到了96.6%以上. 相似文献
7.
对抗样本生成是一种通过添加较小扰动信息,使得神经网络产生误判的技术,可用于检测文本分类模型的鲁棒性。目前,中文领域对抗样本生成方法主要有繁体字和同音字替换等,这些方法都存在对抗样本扰动幅度大,生成对抗样本质量不高的问题。针对这些问题,该文提出一种字符级对抗样本生成方法(PGAS),通过对多音字进行替换可以在较小扰动下生成高质量的对抗样本。首先,构建多音字字典,对多音字进行标注;然后对输入文本进行多音字替换;最后在黑盒模式下进行对抗样本攻击实验。实验在多种情感分类数据集上,针对多种最新的分类模型验证了该方法的有效性。 相似文献
8.
王道才 《电脑爱好者:普及版》2008,(3):54-57
利用在线朗读网站和各种中英文朗读软件,可以解放你的眼睛。如今信息高速发展,每天有大量信息通过我们那双可怜巴巴的眼睛,上网看电影、电视、电子书籍和新闻,看得眼睛酸胀、颈椎僵直时,是否渴望嗑着瓜子听书的情景?让电脑自动给你朗读网页新闻、电子书籍和文档,你则可以悠闲地喝着茶水、做—做室内运动或者闭上眼睛休息一小会儿。 相似文献
9.
“尽”与“烬”音同、形相近,易误用。“烬”是一个名词.只有一个含义,即表示物体燃烧后剩下的东西,如“灰烬”、“余烬”。而“尽”用法较多,共有4个含义,(1)表示“完”,如“取之不尽”、“言无不尽”,“燃尽”表示“燃烧完”。(2)表示“达到极端,如“山穷水尽”,(3)表示“全部用出”如“人尽其才,物尽其用”,(4)表示“所有的”.如“尽人皆知”等。 相似文献
10.
字音转换问题一直是中文语音合成系统中不可缺少的模块,而确定多音字在文章的特定环境中读什么音是其核心问题。本文以全宋词为研究对象,实现了全宋词的字音转换,其中多音字消歧方法有三种:条件策略,词性策略,格律校正。本系统采用现代汉语字音转换方法和宋词格律特点结合来实现,其中宋词字音转换的多音字标注准确率提高到96.89% 相似文献