排序方式: 共有12条查询结果,搜索用时 20 毫秒
1.
汉语语音合成系统评测中MOS和PC评估方法的比较 总被引:1,自引:0,他引:1
采用主观印象评测(MOS)和成对比较评测(PC)两种方法对已有的四个汉语语音合成系统进行了评测。17名普通话讲的很好的大学三年级学生参加了评测,其中男同学10名,女同学7名。在MOS中,文章从系统的整体印象、努力程度、理解程度、语速、发音(重音、停顿)及悦耳程度6个方面进行了评测。评测结果显示:听音的努力程度与系统的整体印象相关性最大,对系统整体印象的影响最大,其次是声音的悦耳程度。评测比较结果显示,PC测试同MOS测试具有很好的一致性,对于没有专家参与的评测中,PC方法更简单易用。 相似文献
2.
针对多噪声环境下的语音识别问题,提出了将环境噪声作为语音识别上下文考虑的层级语音识别模型。该模型由含噪语音分类模型和特定噪声环境下的声学模型两层组成,通过含噪语音分类模型降低训练数据与测试数据的差异,消除了特征空间研究对噪声稳定性的限制,并且克服了传统多类型训练在某些噪声环境下识别准确率低的弊端,又通过深度神经网络(DNN)进行声学模型建模,进一步增强声学模型分辨噪声的能力,从而提高模型空间语音识别的噪声鲁棒性。实验中将所提模型与多类型训练得到的基准模型进行对比,结果显示所提层级语音识别模型较该基准模型的词错率(WER)相对降低了20.3%,表明该层级语音识别模型有利于增强语音识别的噪声鲁棒性。 相似文献
3.
针对不同特征向量下选择最优核函数的学习方法问题,将多核学习支持向量机(MK-SVM)应用于音乐流派自动分类中,提出了将最优核函数进行加权组合构成合成核函数进行流派分类的方法。多核分类学习能够针对不同的声学特征采用不同的最优核函数,并通过学习得到各个核函数在分类中的权重,从而明确各声学特征在流派分类中的权重,为音乐流派分类中特征向量的分析和选择提供了一个清晰、明确的结果。在ISMIR 2011竞赛数据集上验证了提出的基于多核学习支持向量机(MKL-SVM)的分类方法,并与传统的基于单核支持向量机的方法进行了比较分析。实验结果表明基于MKL-SVM的音乐流派自动分类准确率比传统单核支持向量机的分类准确率提高了6.58%,且该方法与传统的特征选择结果比较,更清楚地解释了所选择的特征向量对流派分类的影响大小,通过选择影响较大的特征组合进行分类,分类结果也有了明显的提升。 相似文献
4.
对于用户通过哼唱输入进行音乐检索系统中,音符的切分和识别是关键问题之一。本文介绍了利用隐马尔可夫模型对音符进行建模识别,完成用户哼唱输入自动音乐信息检索的前端处理的初步研究结果。文中给出了音乐中音符、静音及停顿模型的拓扑结构,通过规范化的训练建立了49个音符的隐马尔可夫参数模型。在音符的状态切分中,提出了基于k-均值聚类的状态粗切分方法,减少了手工劳作,提高了分割精度。研究结果表明;在没有语言模型的情况下,获得了46.04%的音符识别率,验证了其方法的可行性。本研究在音乐信息检索领域具有重要的意义。 相似文献
5.
随着Web2. 0的推广,音乐分享平台纷纷出现.目前的音乐分享平台在用户上传时没有进行检查,导致音乐库里常有大量的冗余.提出了一个基于乐纹的音乐分享平台系统LILT,该系统包含一个含有音乐乐纹的数据库,并通过提取音乐片段的乐纹进行查找判重.建立了6万余首歌的乐纹库,并且在这个库上做了大量测试.测试结果显示,该系统对用户上传的音乐能够有效地识别并判重.在系统识别率、识别速度、指纹鲁棒性测试中均得到了较满意的结果. 相似文献
6.
SOCKS5是一个标准的网络代理协议,其原理是SOCKS5代理服务器和客户建立联系后,客户的数据都以TCP数据包的形式发送到SOCKS5代理服务器,然后由其转发,并将接收的数据分发给相应的客户,基于TCP代理过程为:双方建立连接、客户代理请求协商,客户身份及口令验证,TCP协商并实现连接、绑定、UDP请求等操作。基于UDP代理协议过程前3项同TCP,其后UDP协商和数据收发。使用SOCKS5代理技术,在网络寻呼系统应用软件,采用SOCKS系列和WINGATE系列代理服务器,成功实现了TCP和UDP代理。 相似文献
7.
零样本学习是机器学习和图像识别领域重要的研究热点.零样本学习方法通常利用未见类与可见类之间的类别语义信息,将从可见类样本学习到的知识转移到未见类,实现对未见类样本的分类识别.提出了一种基于视觉特征组合构造的零样本学习方法,采用特征组合的方式构造产生大量未见类样例特征,将零样本学习问题转化为标准的监督学习分类问题.该方法模拟了人类的联想认知过程,其主要包括4步:特征-属性关系提取、样例构造、样例过滤、特征域适应.在可见类样本上抽取类别属性与特征维度的对应关系;利用特征-属性关系,通过视觉特征的组合构造的方式,产生未见类样例;引入非相似表示,过滤掉不合理的未见类样例;提出半监督特征域适应和无监督特征域适应,实现未见类样例的线性转换,产生更有效的未见类样例.在3个基准数据集(AwA,AwA2和SUN)上的实验结果显示,该方法效能优越,在数据集AwA上获得了当前最优的Top-1分类正确率82.6%.实验结果证明了该方法的有效性和先进性. 相似文献
8.
基于音乐语义标签的音乐相似计算研究是音乐信息检索领域的另一个新的热点。该文提出一种基于标签挖掘的歌曲分类方法,以Last.fm音乐网站上的用户标签为特征进行歌曲相似性研究。文中将文本聚类中常用的潜在语义分析(LSA)方法和改进的K-means聚类方法相结合,应用于音乐语义标签的自动抽取;从音乐网站last.fm上抽取了6大类600首歌曲的8000多个用户标签作为音乐语义特征,并利用LSA进行歌曲向量的降维,形成了一个表示歌曲间相似关系的600×150维向量矩阵。最后利用K均值,根据音乐歌曲间的相似度进行歌曲分类,完成歌曲相似性比较。实验结果同没有LSA降维前及已有的HCC结果比较表明,使用文中提出的基于音乐标签的模型对歌曲进行分类,能得到较好的分类效果。 相似文献
9.
针对自动的音乐流派分类这一音乐信息检索领域的热点问题,提出了多模态音乐流派分类的概念。针对传统的基于底层声学特征的音乐流派分类中的特征选择环节,实现了一种全新的特征选择算法——基于特征间相互影响的前向特征选择算法(IBFFS)。开创性地使用LDA(latent Dirichlet allocation)模型处理音乐标签,将标签属于每个流派的概率通过计算转换为对应的音乐属于每个流派的概率。 相似文献
10.
歌词与内容相结合的流行音乐结构分析 总被引:1,自引:0,他引:1
针对目前学术界主流的基于内容提取音乐结构开销过大和产生冗余碎片的问题,提出通过歌词分析对音乐结构进行自动提取,同时结合基于内容的SVM分类,以歌曲节拍为单位进行有无人声的判别,进一步对歌词提取的边界进行校正,精确了音乐结构的边界点。在相同数据集上的实验中,这种歌词与内容分析相结合的音乐结构提取算法对桥段和尾奏的分析准确率分别提高了9%和11%。 相似文献