首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 9 毫秒
1.
基于汉语句模的中文分词算法   总被引:8,自引:2,他引:6  
张滨  晏蒲柳  李文翔  夏德麟 《计算机工程》2004,30(1):134-135,191
讨论了在汉语信息计算机处理中的中文分词问题。综合考虑可行性和准确性,提出了旨在降低分词难度和提高分词精度的基于汉语句模理论的处理策略。实验表明,该方法是可行的和具有广阔发展空间的。  相似文献   

2.
数据库汉语查询语言的分词研究与实现   总被引:3,自引:2,他引:3  
在综合考虑数据库查询这一特殊性的基础上,根据查询语句中词汇对数据查询不同贡献程度分级建立分词词典;然后提出了分步- - 正向单扫描的分词方法(DSWS) ,并对该分词方法的时间复杂度进行了分析。  相似文献   

3.
基于DSP的语音识别系统的研究与设计   总被引:1,自引:1,他引:1  
针对在PC机上实现的语音识别系统具有运行费用高、功耗大和体积大的问题,本文提出了以TMS320VC5509低功耗芯片为核心的语音识别系统方案,设计了系统的硬件结构,研究语音信号的特征提取和编码,建立前向-后向隐马尔可夫(HMM)模型,实现孤立词的语音识别.该系统具有运行费用低、功耗小和占用空间小的特点.  相似文献   

4.
一种基于EM非监督训II练的自组织分词歧义解决方案   总被引:1,自引:0,他引:1  
摘要本文旨在提供一种基于非监督训练的分词歧义解决方案和一种分词算法。基于EM的思想,每个句子所对应的所有(或一定范围内)的分词结果构成训练集,通过这个训练集和初始的语言模型可以估计出一个新的语言模型。最终的语言模型通过多次迭代而得到。通过一种基于该最终语言模型的统计分词算法,对于每个句子至少带有一个歧义的测试集的正确切分精度达到85.36%(以句子为单位)。  相似文献   

5.
随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文首先介绍了文音相似度的概念,然后给出了利用文音相似度设计开发语音查询系统的过程和例子。  相似文献   

6.
根据话头自足句理论进行标点句的话头自足句识别任务,探究语言模型在该任务中的应用效果,进一步将该任务划分为单个标点句的话头自足句识别和标点句序列的话头自足句识别。在单个标点句的话头自足句识别任务中,对该任务在形式上进行了完整的定义,将其形式化为机器阅读理解任务。从结果来看,在《围城》语料上取得了83.46%的准确率,在"鱼类百科"语料上的准确率达到91.21%。在标点句序列的话头自足句识别任务中,利用单个标点句的话头自足句识别任务中训练好的模型,以流水线的方式进行标点句序列的话头自足句识别,在"鱼类百科"语料上的准确率达到82.03%。实验结果表明,提出的方法能够有效地提高中文话头自足句识别的准确率。  相似文献   

7.
本文介绍了一种微型计算机汉语词汇处理系统及其分词算法的设计、该系统在中文信息处理技术中有较好的应用价值。  相似文献   

8.
一种基于EM非监督训练的自组织分词歧义解决方案   总被引:13,自引:1,他引:12  
本文旨在提供一种基于非监督训练的分词歧义解决方案和一种分词算法。基于EM的思想,每个句子所对应的所有(或一定范围内)的分词结果构成训练集,通过这个训练集和初始的语言模型可以估计出一个新的语言模型。最终的语言模型通过多次迭代而得到。通过一种基于该最终语言模型的统计分词算法,对于每个句子至少带有一个歧义的测试集的正确切分精度达到85.36%(以句子为单位) 。  相似文献   

9.
基于HMM算法的语音识别系统设计及其混合编程实现   总被引:3,自引:0,他引:3  
许丽红  余小清  万旺根 《计算机工程》2002,28(5):139-140,163
介绍了连续M元高斯混合密度的隐马尔可夫语音识别系统,提出了一种基于分段K平均法的初始化模型参数方法;将可靠性度量方法结合到Baum-Welch重估算法中去,简化了算法复杂度。系统的实现采用C++与Matlab混合编程,提高了整个系统的开发效率。  相似文献   

10.
电话语音查询系统的原理、编程及系统的硬件、软件设计,给出了事件驱动实现多任务的具体方法。  相似文献   

11.
易小琳  王鑫 《计算机工程》1999,25(11):17-18,34
介绍利用多媒体处理技术,在多媒体计算机上实现的从带噪声的语音信号中提取原始语音方法的研究及该方法的设计与开发。  相似文献   

12.
基于快速神经网络算法的非特定人语音识别   总被引:4,自引:0,他引:4       下载免费PDF全文
提出一种用于语音识别的改进的快速神经网络算法 ,即动态不等步长的误差分段学习算法。将步长看作误差和网络节点输出的函数 ,对各权值按不同步长进行动态调整 ,并将其应用于一个基于前馈神经网络模型的非特定人语音识别系统。实验表明 ,该算法比传统 BP算法在训练速度上可提高十几倍 ,训练出的语音识别网络系统具有较高的识别率  相似文献   

13.
提出一种语音命令控制车载音响操作的设计方案,以德国Infineon公司新推出的具有DSP和单片机双核的SoC语音处理芯片UniSpeech-SDA80D51为核心组成非特定人车栽音响语音控制系统,并实现了系统样机的研制.该系统在江淮同悦SL1102C1型车载音响上进行了语音控制实测,实测数据表明系统语音识别率可达到95%.  相似文献   

14.
城市公交查询系统的研究与设计   总被引:10,自引:0,他引:10  
给出了城市公交查询系统的空间数据结构。在Dijkstra算法的基础上,借助人工智能中状态空间搜索和动态截枝的思想,提出了状态空间搜索求第K最短路径的智能搜索算法。该算法能对所查询的交通路线与乘车方案等用电子地图的形式给予显示,并更换不同城市的地图。测试表明,该系统具有速度快、多媒体显示、维护方便、通用性强等特点。  相似文献   

15.
在“现代汉语句法语义信息语料库”的基础上,我们将相对独立的句型系统、句模系统和句干系统有机整合在一起,建立了一个有层级体系的句系系统。并将[P]、[SP]、[SPO]、[PO]定义为基础句型,利用解析法,考察了基础句型对应的高频句模在复杂句模生成机制中的主体作用,此外还考察了补语、状语同语义成分的对应情况。通过寻求简单句型和复杂句型、简单句模和复杂句模之间的组合映射规律,从而找到句型句模对应机制研究的一个新的突破点。  相似文献   

16.
文章首先介绍了句子句法、语义结构标注语料库的基本情况。在标注语料库的基础上,从句型的角度着眼定量统计,构建现代汉语单句的句型句模的对应体系,并进一步说明了句型句模对应关系研究的意义。  相似文献   

17.
基于CAPTCHA和Winnow算法的垃圾短信过滤研究   总被引:1,自引:1,他引:0  
为识别并过滤掉日益增多的垃圾短信,提出了基于全自动人机识别系统(CAPTCHA)和Winnow算法的过滤方法。在CAPTCHA方法中,根据用户能否正确辨认图片,人类和计算机能被辨别,该方法能有效地过滤计算机发送的组垃圾短信。改进的Winnow过滤器可以直接处理原始文本,节省了中文分词时间,而且利用了复合分类思想,提高了分类精度。实验结果表明,CAPTCHA和改进的Winnow算法相结合能较准确地过滤掉垃圾短信。  相似文献   

18.
提出了一种采用SPCE061A单片机构建基于语音处理技术的人机交互系统的设计方案,给出了系统结构,介绍了系统音频输入电路、音频输出电路的设计,详细介绍了语音播放及语音识别功能的软件实现方案。实验测试结果表明,该系统性能良好,语音识别正确率较高,但易受训练和识别环境的影响。  相似文献   

19.
多语言综合信息服务系统研究与设计   总被引:1,自引:0,他引:1       下载免费PDF全文
肖荣  吴英姿 《计算机工程》2009,35(2):263-264
基于多语言的综合信息服务正成为信息服务领域的一个重要的发展方向。该文提出面向2010年上海世博会和城市信息服务的多语言综合信息服务应用的总体架构,该系统基于下一代网络技术,在逻辑上分为七层架构。系统通过多种类型的门户,集成和应用包括多语言语音识别、合成、机器翻译等关键技术,整合现有的城市信息服务资源,为用户提供方便、快捷的多语言综合信息服务。  相似文献   

20.
语音识别也称自动语音识别,是将人类语音中的词汇转换为计算机可读的输入,而HTK(HMM ToolKit)是构建隐马尔可夫模型和识别的工具包,最早是由英国剑桥大学工程系设计和开发的,目前广泛应用于语音识别、语音合成、字符识别等多个领域。本文主要是使用语音识别工具HTK建立语音识别系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号