首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
将专家系统方法中类似医生凭化验单进行诊断的判断操作,归结为一个以n维超平行体为定性基准,以人工神经元为其定性基准一个((n-1)维超平面)边界的定性映射.并指出,人工神经元可看作是一个定性基准仅有一个有限边界,而其余边界均消失在无穷远点的定性映射.若以一组人工神经元所围封闭邻域为其定性基准,则该定性映射等价于这组神经元构成的人工神经网络.还讨论了定性基准的伸缩、平移和叠加(或整合)等(线性)变换与人工神经元网络的关系,指出,定性基准的伸缩等价于连接权重的调节,平移等价于阈值调整,叠加等价于边界(人工神经元)旋转.也就是说,带定性基准线性变换的定性映射,不仅具有人工神经网络的所有调节功能,而且,可表示真值随定性基准而变的动态判断和识别过程.  相似文献   

2.
该文建设性地提出基于分布式组件技术(DCOM)构建多层网络化机器人远程控制系统,利用分布式组件技术实现了机器人的远程控制和网络共享。通过对语音识别技术的研究,在引进IBM ViaVoice语音识别的基础上,使语音识别技术与机器人控制系统有机结合实现机器人语音识别与控制。结合DCOM和IBM ViaVoice两者技术可以实现语音远程控制,使声音通过网络加以延伸,使控制者离开机器人嘈杂的操作环境,对远距离的机器人进行语音控制,使语音识别率得到很大的提高。  相似文献   

3.
语音识别技术是近年来信息技术领域重要的科技发展技术之一.作为一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术.笔者简要介绍了语音识别技术的关键技术,以及所面临的困难与挑战.  相似文献   

4.
针对传统的基于码书映射的语音转换算法转换语音与目标语音相似度不高的问题,提出一种新的基于权重比例分配的码书映射语音转换方法。在训练阶段,通过设置不同权重阈值将码书权重矩阵稀疏化,分析大于阈值的码书权重值对转换语音影响的大小,根据不同权重值对转换语音的影响比例不同这一特点,训练码书权重的映射关系。在转换阶段,利用训练阶段得到的映射关系,将源码书权重映射得到目标码书权重,利用该权重和目标码书合成转换语音。对传统算法和本文算法进行仿真对比实验,从主观和客观两方面进行测试。实验结果表明,基于权重比例分配的码书映射的语音转换算法不仅可以有效地改善转换语音的音质,同时也大大提高了转换语音与目标语音的个性特征的相似度。  相似文献   

5.
在办公自动系统中加入语音功能可大大提高系统的吸引力.描述了将语音技术引入到办公自动化系统中的设计和实现,以Patteck ASR语音识别引擎和USTC iFly语音合成引擎为例,给出了在办公自动化系统中开发语音功能的主要设计思想、系统结构,并以VC编程语言为支持平台说明了程序实现方法、流程与步骤.  相似文献   

6.
基于RBF神经网络的语音情感识别   总被引:2,自引:0,他引:2  
介绍了径向基函数神经网络的原理、训练算法,并建立了RBF神经网络的语音情感识别的模型。在实验中比较了BP神经网络与RBF神经网络分别用于语音情感识别识别率,RBF神经网络的平均识别率高于BP神经网络3%。结果表明,基于RBF神经网络的语音情感识别方法的有效性。  相似文献   

7.
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值.  相似文献   

8.
本文以软件无线电为操作平台,研究了混沌语音保密通信系统。采用Logistic映射时间离散序列和Rossler时间连续方程产生混沌,并调制到软件无线电中,形成一套基于软件无线电的混沌语音保密系统。运用计算机进行了语音保密通信仿真实验。文中对两种混沌信号发生原理进行讨论,在软件无线电系统中对安全特性进行了比较分析。  相似文献   

9.
介绍了一种小词汇量的语音识别方法。在传统的DTW语音识别的基础上,通过放宽端点、对路径进行斜率限制和改进局部路径限制等方法,使系统能够实现快速的识别响应,尤其是对于小词汇量和特定人识别,可以有效地提高响应速度和识别率。  相似文献   

10.
使用LD3320芯片,将普通垃圾桶与语音识别相结合,实现垃圾分类语音化、智能化。系统将外部声音信息在模块芯片中进行内部频谱检测,提取关键词并与事先存储在模块中的关键词进行比较和匹配,并控制桶盖打开到相应位置,从而实现垃圾的分类投放。该设计能有效地帮助用户实现垃圾分类。  相似文献   

11.
湖北方言在音系结构上有其自身的特点,大学生的方言发音习惯对英语语音习得产生了负迁移作用。抽样调查发现湖北方言对大学生英语发音的影响主要表现在音段和超音段两个层面上,在音段层面上出现辅音发音偏误和元音发音偏误;在超音段层面上导致某些音节、重音、声调、语调的偏误。教师应通过教学环节帮助学生纠正英语发音偏误,消除湖北方言对英语发音的负面影响,促使湖北大学生讲一口流利而地道的英语。  相似文献   

12.
湖北方言在音系结构上有其自身的特点,大学生的方言发音习惯对英语语音习得产生了负迁移作用.抽样调查发现湖北方言对大学生英语发音的影响主要表现在音段和超音段两个层面上,在音段层面上出现辅音发音偏误和元音发音偏误;在超音段层面上导致某些音节、重音、声调、语调的偏误.教师应通过教学环节帮助学生纠正英语发音偏误,消除湖北方言对英语发音的负面影响,促使湖北大学生讲一口流利而地道的英语.  相似文献   

13.
语音学习是整个英语学习过程中非常重要的一个环节,它在很大程度上决定一个语言学习者整个英语学习的进展和效果。因为它与听、说、词汇、语法和阅读等有着密切的联系。此外,各种语言技能的获得也均以语音为本。因此,从某种意义上讲,学好英语语音是学好英语的先决条件。  相似文献   

14.
基于小波变换的字符识别快速算法   总被引:7,自引:0,他引:7  
提出了一种基于小波变换的识别图像中英文字母、数字以及汉字字符的快速算法.算法通过将字符二值化点阵图像进行垂直与水平方向投影,实现了从二维图像数据到一维数据的转化.对于W×H大小字符图像,相对于传统算法,本算法将运算量从W×H数量级降至W+H数量级,大大降低了后续处理运算的时间复杂度,同时保留了足够的关于字符垂直及水平点阵分布的特征信息.将投影得到数据进行2层小波分解,从其中各层平滑分量提取一个特征信息,将其与模板字符对应的特征信息进行分析比较,实现了字符的快速高效识别.实验结果表明,运用此快速算法可使字符总的识别率达到92%以上.  相似文献   

15.
基于能量场边缘提取和改进Hough变换的图像几何特征检测   总被引:1,自引:0,他引:1  
根据光纤定位管图像的特点,提出了一种基于Hough变换的几何特征精密测量的方法。对图像进行能量场边缘提取后,通过改进的Hough变换求出图像中基本的几何元素:圆和直线的方程,进而精确确定其几何特征如:角点的位置等。试验结果表明,本方法可用于含噪图像中的几何特征检测,该方法具有较好的准确性和较强的稳定性。  相似文献   

16.
提出了一种嵌入式平台下英文名片字符识别的设计思想和实现方法,研究出了一套适合于嵌入式平台的字符识别系统。应用高效的特征提取算法和合理的分类器设计算法能够识别斜体、黑体和常用字体的英文字符和数字,其识别率达到95.5%。  相似文献   

17.
本文介绍了采用TuboC语言开发西文DOS状态下中文下拉式菜单的方法.给出了建立、调用小汉字库的方法及程序清单.该软件可独立运行于PC系列及其兼容机,自动适配于CGA、EGA及VGA显示器.生成的下拉式菜单界面友好,操作简单.  相似文献   

18.
普通话语音识别中的基本音素分析   总被引:2,自引:1,他引:2  
分析普通话发音的基本音素,选取8个元音音素和22个辅音音素作为发音构成的基础,列出了由音素构成汉语拼音声母和韵母的方法,从而为形成从音素到拼音的两步式识别法奠定了基础.  相似文献   

19.
将待输出的语句,由数字量转换成模拟量,再通过扬声器等电声转换媒介,使声音获得再现,此语音再现系统具有脱机使用的功能。  相似文献   

20.
In order to improve the Mandarin vowel pronunciation quality assessment, a nox/el formant feature was proposed and applied to formant classification for Chinese Mandarin vowel pronunciation quality evaluation. Formant candidates of each frame were plotted on the time-frequency plane to form a bitmap, and its Gabor feature was extracted to represent the formant trajectory. The feature was then classified by using GMM model and the classification posterior probability was mapped to pronunciation quality grade. The experiments of comparing the Gabor transformation based formant trajectory feature with several other kinds of traditionally used features show that with this method, a human-machine scoring correlation coefficient (CC) of 0.842 can be achieved, which is better than the result of 0.832 by traditional speech recognition techniques. At the same time, considering that the long-term information of formant classification and the short-term information of speech recognition technique are complementary to each other, it is investigated to combine their results with linear or nonlinear methods to further improve the evaluation performance. As a result, experiments on PSK show that the best CC of 0.913, which is very close to the correlation of inter-human rating of 0.94, is gotten by using neural network.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号