首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词干的本身特点研究现代维吾尔语词干语法语义分类体系迫切性;讨论信息处理用现代维吾尔语一类、二类、三类和四类词干词类标记规范。  相似文献   

2.
词干提取是形态丰富语言信息处理中的基础任务,对其他自然语言处理任务有着重要的影响。该文将词干提取任务看作序列标注问题,以字符为切分粒度来表征维吾尔语单词的构成机制,结合条件随机场模型,实现基于字符序列标注的维吾尔语词干提取方法。首先使用词典查询方法进行词干提取,然后结合字符的弱化发音特征、音类特征以及语音特征,针对受限数据和非受限数据采用条件随机场训练模型及预测结果。实验结果表明,该方法在非受限数据集上效果较佳,且能广泛应用到其他语言。  相似文献   

3.
哈萨克语词干提取是哈萨克语信息处理的重要的基础环节,文章采用基于规则、字典查找和最大匹配相结合的哈萨克语词干提取方法,首次提出结合哈萨克语元音和谐规律、词干词性和词尾缀接顺序切分词尾,使得词干提取正确率达95.26%。  相似文献   

4.
在自然语言处理中词性标注和词干提取是最重要的任务。文中研究与实现基于Android的维吾尔文词性标注和词干提取APP,为维吾尔语自然语言处理工作开发出了快捷和方便的标注平台,目的是通过APP对大规模语料进行词性标注和词干提取,实现了广大学员通过一部Android系统的手机随时随地参与语料标注任务,从而完成了大规模语料的标注工作,将其应用到文本分析、机器翻译、语音合成、语音翻译等研究领域。该系统的实现为低资源少数民族智能化研究工作做出了贡献。  相似文献   

5.
为了更好地为口语语言处理服务,首次从实验语音学的角度出发,对维吾尔语中的长元音进行了声学分析。实验结果表明维吾尔语中的长元音虽然在一定条件下读音比一般元音长一些,但并未形成长短对立,因此没有音位意义,它只是起到保持词语节律性的要素;维吾尔语中的长元音有时候具有区别词义的作用,但这种情况不多。对维吾尔语中的这种元音长读现象进行声学分析便于定论维吾尔语是否存在长元音。  相似文献   

6.
维吾尔语属阿尔泰语系突厥语族,其共振峰频率参数是语音识别和语音合成的重要依据。首次运用实验语音学的基本理论和方法,在“维吾尔语语音声学参数数据库”的办公环境语料条件下,对维吾尔语四音节元音和谐词进行了统计分析,给出了维吾尔语元音共振峰频率参数和分布规律,并通过四音节元音和谐词实验结果,用实验数据验证了其共振峰频率分布的口耳之学规律。为参数式或波形拼接式语音合成系统中调整合成前的元音和谐问题提供了重要的参考依据。  相似文献   

7.
研究了基于附加信号的回波抵消技术.首先,给出了基于附加信号的回波信道估计算法.然后针对此算法中存在的由于迭代误差累积导致信道估计误差较大的问题,提出了设置恰当的阈值和从主径开始估计信道的两种解决措施.然后重点阐述了后一种解决措施.通过MATLAB仿真测试,此算法有效地完成了回波抵消.  相似文献   

8.
该文根据语音合成和语音识别的实际需求出发,从实验语音学的角度从《维吾尔语语音参数库中》选择了带元音/u/的330个音节词,分别对非清化状态和清化状态下进行语音学研究。在非清化状态下,对其元音的共振峰值进行了统计分析,归纳了共振峰分布特点来考察元音/u/的基本声学特征,结合实验结果对该元音的语音特点做进一步讨论分析。再对其元音发生清化和保持原来浊特性时的时长,音高和音强进行了统计分析,归纳了其发生清化时的时长,音强,共振峰的分布模式,探讨了元音/u/的清化特性,并验证了语音学者凭听力和生理而总结出来的结论和声学上的结论的一致性。其目的是为了提高语音合成的自然度,即更好地为自然语言处理服务。  相似文献   

9.
基于形态预处理和标记提取的分水岭分割算法   总被引:2,自引:0,他引:2  
为了解决传统分水岭算法的过分割问题,提出了一种基于内外标记的改进分水岭图像分割方法.该方法在形态增强图像的基础上,进行形态学开闭重构运算,在不影响图像中原有景物结构及边缘结构的同时,去除图像中的暗纹理和噪声.从重建后的增强图像中对感兴趣的目标和背景进行标记提取.依据标记利用形态学极小值标定技术对形态梯度图像进行修正,最后使用分水岭算法对修正后的梯度图像进行分割.该方法能够有效地抑制过分割现象,复杂度较低,并可通过调整图像分割过程的参数,得到理想的图像分割效果.  相似文献   

10.
针对传统方法不能有效抽取维吾尔语事件因果关系的问题,该文提出一种基于双向LSTM(Bidirectional Long Short-Term Memory, BiLSTM)的维吾尔语事件因果关系抽取方法。通过对维吾尔语语言以及事件因果关系特点的研究,提取出10项基于事件内部结构信息的特征;同时为充分利用事件语义信息,引入词嵌入作为BiLSTM的输入,提取事件句隐含的深层语义特征并利用批样规范化(Batch Normalization, BN)算法加速BiLSTM的收敛;最后融合这两类特征作为softmax分类器的输入进而完成维吾尔语事件因果关系抽取。实验结果表明,该方法用于维吾尔语事件因果关系的抽取准确率为 89.19%, 召回率为 83.19%, F值为86.09%,证明了该文提出的方法在维吾尔语事件因果关系抽取上的有效性。  相似文献   

11.
维吾尔语是黏着语,词汇量较多,容易出现未登录词问题并且属于低资源语言,导致维吾尔语的端到端语音识别模型性能较低。针对上述问题,该文提出了基于多任务学习的端到端维吾尔语语音识别模型,在编码器层使用Conformer并与链接时序分类(CTC)相连接,通过BPE-dropout方法形成鲁棒性更强的子词,以子词和字作为建模单元,同时进行多任务训练和解码。实验结果分析发现,子词作为建模单元能有效解决未登录词问题,多任务学习模型能在低资源环境下较充分利用数据,学习到丰富的时序语音特征信息,进一步提升模型的识别性能。在公开的维吾尔语语音数据集THUYG-20上与基线相比把子词错误率和字错误率分别降低7.3%和3.8%。   相似文献   

12.
基于Bi-LSTM的维吾尔语人称代词指代消解   总被引:1,自引:0,他引:1       下载免费PDF全文
针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络(Bi-directional long short term memory,Bi-LSTM)的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LSTM的输入,挖掘维吾尔语隐含的上下文语义层面特征;其次对维吾尔语人称代词指代现象进行探索,提取针对人称代词指代研究的24个hand-crafted特征;然后利用多层感知器(multilayer perception,MLP)融合Bi-LSTM学习到的上下文语义层面特征与hand-crafted特征;最后使用融合的两类特征训练softmax分类器完成维吾尔语人称代词指代消解任务.实验结果表明,充分利用两类特征的优势,维吾尔语人称代词指代消解的F1值达到76.86%.实验验证了Bi-LSTM与单向LSTM、浅层机器学习算法的SVM和ANN相比更具备挖掘隐含上下文深层语义信息的能力,而hand-crafted层面特征的引入,则有效提高指代消解性能.  相似文献   

13.
针对深度神经网络模型仅学习当前指代链语义信息忽略了单个指代链识别结果的长期影响问题,提出一种结合深度强化学习(deep reinforcement learning)的维吾尔语人称代词指代消解方法.该方法将指代消解任务定义为强化学习环境下顺序决策过程,有效利用之前状态中先行语信息判定当前指代链指代关系.同时,采用基于整体奖励信号优化策略,相比于使用损失函数启发式优化特定的单个决策,该方法直接优化整体评估指标更加高效.最后在维吾尔语数据集进行实验,实验结果显示,该方法在维吾尔语人称代词指代消解任务中的F值为85.80%.实验结果表明,深度强化学习模型能显著提升维吾尔语人称代词指代消解性能.  相似文献   

14.
维吾尔语的塞音同英语有清浊之分,对维吾尔语中的浊塞音和清塞音进行声学研究,从"维吾尔语语音声学参数库"中选取466个包含浊塞音及981个清塞音的词,采集了它们时长,无声段(GAP)和嗓音起始时间(VOT)这3种最基本的声学特征参数,给予了详细地实验分析并通过对比研究验证了VOT和GAP是区分浊塞音和清塞音的重要参数,其目的是为了更好地为自然语言处理服务,对同属语族的语言有较高的参考价值。  相似文献   

15.
由于TD—SCDMA网络还处于初级阶段,在网络中难免会存在一定的弱覆盖和覆盖空洞。为了提高客户的感知度和运营商的品牌效应,使那些处于小区覆盖边缘和3G信号较差的用户不产生掉话而更好的切换至信号覆盖较好的GSM小区,2G/3G互操作起了一个很好的桥梁作用。本文通过对2/3G互操作优化的研究,引出了3A事件的附加测量参数,通过案例分析的手段,对该参数进行了深入的探讨和研究,并依据移动集团公司的优化思路,进行了参数设置方面的建议。  相似文献   

16.
毕峰  邱天爽  余南南 《信号处理》2013,29(3):405-409
诱发电位的少次提取对于研究大脑活动规律以及临床诊断等均有重要意义。根据诱发电位与自发脑电信号的不同特点,本文提出一种基于形态分量分析的诱发电位少次提取方法,在不同的过完备字典上对诱发电位与自发脑电信号进行稀疏表示。为了改善在稀疏表示过程中的错误分解问题,提出使用几次带噪观测信号的叠加平均结果作为模板信号,并使用K-SVD算法训练得到合适的过完备字典,再对当前观测信号进行混合稀疏表示。实验结果表明,该方法能够有效地降低由通用过完备字典进行稀疏表示时的错分程度,较好地实现对诱发电位信号的提取。   相似文献   

17.
随着IP电话的快速发展,用户对基于IP电话的新业务的需求也日益增长,传统电话业务正在被移植到IP多媒体电话系统中,由于IP电话系统在信令结构方面与传统电话系统的集中模型有着本质的区别,因此基于IP电话系统的附加业务开发和控制协议的特点具有不同的特点,本文描述了基于H.323标准的附加业务的信令结构和业务设计,并与传统电话交换业务模型加以比较。  相似文献   

18.
文章首先介绍了FPGA技术的运作机理,进一步分析了基于FPGA的实时图像边缘提取系统架构的具体设计方法,并从整体系统架构和系统模块设计两大方面阐述了该系统所选用的相关硬件配置,最后对基于FPGA的实时图像边缘提取系统进行了应用测试,将其边缘检测能力测试和系统资源使用的状况进行了逐一解析,以期能够为相关技术人员提供参考。  相似文献   

19.
针对基于附加信号回波抵消在硬件设计中出现的迭代误差累积导致信道估计不准确和耗费大量FPGA资源的问题,对算法进行了改进。从主径开始估计回波信道的方法,提高了信道估计精度和减少了FPGA资源消耗。然后,在FPGA平台上用硬件语言Verilog HDL对此回波抵消系统加以实现。仿真结果表明此设计在回波抵消方面具有良好的效果。  相似文献   

20.
为提取低信噪比红外雷场图象中的目标,采取了一种基于小波分解和能量特征的目标提取方法.根据目标与环境背景在图像小波变换域能量分布特性的不同而对小波分解得到的各变换域通道能量特征值进行计算,并以此为依据提取出目标.实验结果表明,该方法对红外雷场图象有较好的处理效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号