首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于音乐旋律轮廓的特征提取算法   总被引:1,自引:0,他引:1  
提出了一种基于音乐旋律轮廓的特征提取算法。该算法从哼唱片断中提取出歌曲基音序列,经规整、合并、分段后转化为旋律轮廓序列,然后使用标准音调生成的标准音调差值表将此序列转化为旋律轮廓特征。结果表明,该系统对环境噪声有较好的鲁棒性;在含有405首歌曲的搜索空间中,检索前5位成功率超过90%。  相似文献   

2.
针对基于内容的图像检索系统的检索效率和精度的不足,提出了综合语义和轮廓特征的图像检索方法.以拐点作为控制点对图像的轮廓进行精确分段,利用边界跟踪法对图像进行轮廓特征提取,并以图像的语义和底层的轮廓特征作为图像检索的综合指标,将图像的主观语义和底层特征融合起来,提高了图像底层特征和高层语义之间的联系.通过对不同类型的图像进行检索,实验结果证明该算法对复杂图像检索的效率高、精度高,并具有稳定的检索性能.因此,具有很好的发展趋势.  相似文献   

3.
针对单一特征对商标图像描述的局限性,提出了一种基于轮廓和SIFT特征组合的商标图像检索方法。该方法对二值化的商标图像进行轮廓提取,采用规则算法对其进行轮廓分解,对分解的参考点集进行Fourier变换,将得到的Fourier系数作为参考点的轮廓特征。针对商标图像的尺度空间进行极值点检测,并对检测到的极值点进行特征描述,该特征描述即为商标图像的SIFT特征描述。最后,SIFT特征与轮廓特征进行特征融合,并将融合后的组合特征作为对商标图像的特征描述。  相似文献   

4.
师文  朱学芳 《软件学报》2014,25(7):1557-1569
轮廓描述法作为形状检索中最为关键的步骤,应体现目标的整体形状信息和重要特征点信息,并具备对噪声干扰的鲁棒性.提出一种基于轮廓重构和特征点弦长的图像检索算法,首先在目标轮廓提取的基础上分析轮廓的能量保持率,并进行轮廓的降维重构处理,从而减少了随机噪声造成的轮廓畸变.然后,通过新定义的支持域来计算轮廓点的特征强度,并分析了支持域半径与特征点提取结果的关系,从而筛选出有效的轮廓特征点.最后,根据轮廓点和相应特征点间的弦长关系构造轮廓特征函数,经相应处理后,最终得到的形状描述子满足不变性要求.大量实验结果表明,该算法无论是在常规样本库中,还是在噪声样本库中都具有更优的检索性能.  相似文献   

5.
作为音乐检索的重要方式,哼唱检索由于其有效性和方便性,引起了广泛的关注。对此提出了一种新的基于得分矩阵的音乐哼唱快速检索技术,可以实现哼唱音乐的快速检索。首先根据哼唱音乐特征,将音乐数据库和用户提供的哼唱片段,按自然停顿方式划分音乐的语句,同时使用K-means聚类算法对音乐的语句片段进行音高相似性计算,并根据聚类情况提取出位置特异性得分矩阵。此外,基于得分矩阵提出NA匹配算法和两种加速分段计分方法,分别是顺序前瞻计分SLS算法和置换矩阵前瞻计分PLA算法。实验结果表明所提出的基于得分矩阵的音乐检索技术能够快速有效地返回查询结果,同时PLA算法具有更有效的哼唱音乐检索结果。  相似文献   

6.
综合颜色和轮廓曲线特征的图像检索方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
传统的基于内容图像检索(CBIR)及跟踪算法主要利用图像的颜色、纹理等特征进行相似性比较,但大量的实验和应用也表明利用颜色和纹理进行图像相似性比较在空间结构和对象形状上难以精确控制,致使图像检索经常出现一些不可预料的结果。为了提高图像在形状、颜色及纹理上的检索精度,提出了一种综合颜色和图像轮廓曲线特征的检索方法。该方法分割图像并提取图像中感兴趣对象的轮廓,对提取的轮廓进行仿射变换及最小值化处理,经处理后的轮廓带有边缘的完整信息,具有几何不变性;利用聚类的颜色信息,提取主聚类的直方图,所提取的直方图不仅包含了主聚类的颜色信息也包含了该聚类的空间位置信息。利用检索对象与被检索对象的颜色距离直方图及轮廓曲线距离偏差的加权平均度量检索及被检索对象的相似性。实验结果表明,针对基于感兴趣对象的图像检索问题,给出了一种具有高度检索精度的算法。  相似文献   

7.
李扬  吴亚栋 《计算机工程》2003,29(Z1):117-119
文章提出了一种近似旋律匹配的新方法--线性对齐匹配法.与已有的基于内容的音乐检索不同,该算法并非基于近似符号串匹配、统计模型或者特征空间,而是根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑设计而成的全新算法.在含有1652首乐曲的搜索空间中,检索57段人声哼唱,该方法取得了93%的前3位命中率.这一实验结果表明了线性对齐匹配法的有效性,及其应用于大型数字音乐检索引擎的可行性.  相似文献   

8.
针对Choi Wai-pak等人提出的基于最大内切圆直方图的图像检索算法存在的不足,提出了一种改进的新的基于轮廓的图像检索算法。该算法首先用两种不同尺度的1维高斯函数分别对目标轮廓的凹陷部分和凸起部分进行进化处理来得到一个平滑简单而又能很好代表原始轮廓主要信息的进化曲线;然后利用骨架化算法提取出目标骨架;最后,利用进化后的轮廓与骨架之间的距离直方图来构造目标形状的描述符,并实现了图像检索。与Choi Wai-pak等人提出的算法(只利用了形状的骨架信息)相比,该新算法不仅利用了轮廓所表达的外围整体形状信息,还利用了骨架所表达出的形状的拓扑关系。实验结果表明,该新算法在尺度变换、旋转变换以及抗噪性能等方面具有更优的鲁棒性。  相似文献   

9.
基于边缘直方图的彩色图像检索算法研究   总被引:4,自引:0,他引:4  
图像边缘是重要的视觉感知信息,也是图像最基本的特征之一,其在图像分析和理解中有重要价值.本文以视觉重要的图像边缘轮廓为基础,提出一种基于边缘直方图的彩色图像检索新算法.该算法首先利用Canny检测算子提取出原始图像的彩色边缘轮廓;然后构造出能全面反映边缘轮廓内容的3种直方图(颜色直方图、距离直方图和角度直方图);最后综合利用上述3种边缘直方图计算图像间的内容相似度,并进行彩色图像检索.仿真实验表明,该算法能够准确和高效地查找出用户所需内容的彩色图像,并且具有较好的查准率和查全率.  相似文献   

10.
一种基于边缘综合特征的彩色图像检索算法   总被引:8,自引:1,他引:7  
图像边缘是重要的视觉感知信息,也是图像最基本的特征之一,其在图像分析和理解中有重要价值。以视觉重要的图像边缘轮廓为基础,提出了一种基于边缘综合特征的彩色图像检索新算法。该算法首先利用Canny检测算子提取出原始图像的彩色边缘轮廓;然后构造出能全面反映边缘轮廓内容的两种直方图(边缘颜色直方图和边缘方向直方图);最后综合利用上述两种边缘直方图计算图像间的内容相似度,并进行彩色图像检索。仿真实验表明,该算法能够准确和高效地查找出用户所需内容的彩色图像,并且具有较好的查准率和查全率。  相似文献   

11.
基于内容的音乐检索研究   总被引:2,自引:1,他引:1  
赖国明  杨圣云 《计算机工程与设计》2006,27(23):4467-4468,4528
对音乐的特征表示进行了详细的阐述,详细介绍了乐曲相似性度量方法,并字符串编码方法对音乐特征进行编码,然后使用蛋白质序列局部比对方法对2239首中国乐曲和3960首西方乐曲的音乐库进行大量的检索实验。获取了大量的实验数据,对实验结果进行分析,并取得了较好的检索性能。最后针对音乐检索过程中的每次比对都相互无关的特点,具有可以很好地进行并行化特性,对算法进行并行化,实现在4台高档微机构成的群集上进行了并行检索实验,其检索时间约为串行检索时间的1/4,有很高的加速比。  相似文献   

12.
语音信号基音检测的二次谱方法   总被引:2,自引:1,他引:1  
对基音检测的倒谱法进行了分析,指出其在基音检测计算及其数字实现时存在不足。为 了克服这些不足,提出了一种功率谱二次处理的二次谱基音检测方法,该方法在克服了倒谱法在基音 检测中不足之处的同时还提高了计算速度,基音轨迹曲线估计的准确性也得到了改善。  相似文献   

13.
提出了一种基于隐马尔科夫模型(HMM)的汉语韵律短语的统计基频模型,并尝试使用蒙特卡罗方法(Monte-Carlo)从模型生成基频曲线。该模型使用HMM作为基本框架,具有HMM理论体系所能支配的各种优点。并将韵律词作为模型单元,使得模型能够反映韵律层次级的连续变调。Monte-Carlo方法能生成相对模型最优的基频曲线,并保证生成的基频曲线具有足够的精确度。该文最后给出了实验结果并对模型的应用前景进行了展望。  相似文献   

14.
通过对语音转换的研究,提出了一种把源说话人特征转换为目标说话人特征的方法。语音转换特征参数分为两类:(1)频谱特征参数;(2)基音和声调模式。分别描述信号模型和转换方法。频谱特征用基于音素的2维HMMS建模,F0轨迹用来表示基音和音调。用基音同步叠加法对基音周期﹑声调和语速进行变换。  相似文献   

15.
通过对语音转换的研究,提出了一种把源说话人特征转换为目标说话人特征的方法。语音转换特征参数分为两类:(1)频谱特征参数;(2)基音和声调模式。分别描述信号模型和转换方法。频谱特征用基于音素的2维HMMS建模,F0轨迹用来表示基音和音调。用基音同步叠加法对基音厨期、声调和语速进行变换。  相似文献   

16.
用于汉语单音节声调识别的基频轨迹拟合方法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于Target模型的思想,对汉语声调基频轨迹进行研究,总结了四种声调曲线参数的变化规律,提出了对基频轨迹进行分段曲线拟合的方法。使用该方法提取出的反映基频变化趋势的特征向量,在不受基频曲线两端不准确点影响的同时起到了长度归一化的作用。使用该向量进行声调识别,取得了95.17%的满意识别结果。  相似文献   

17.
一种语音信号基音检测的功率谱二次处理方法   总被引:1,自引:0,他引:1  
对基音检测的倒谱法进行了细致的分析,指出其在基音检测计算及其数字实现时存在不足。为了克服倒谱法的不足之处,提出了二种;新的功率谱二次处理基音检测方法,该方法在克服了倒谱法在基音检测中不足之处的同时还提高了计算速度,对基音轨迹曲线的估计准确性也得到了较大改善。  相似文献   

18.
语音基音频率的准确检测是语音信号处理的难点之一。提出一种加权短时自相关函数(Autocorrelation Function,ACF)算法提取基音频率。在传统的ACF方法基础上,利用短时平均幅度差函数(Average Magnitude Difference Function,AMDF)的平方对ACF函数进行加权,由此加强短时自相关函数在基音周期倍数处的峰值特性。对提取出的基频曲线做平滑处理。实验结果表明,该方法提高了基音周期检测的准确率。  相似文献   

19.
李强  于凤芹 《计算机应用》2018,38(8):2411-2415
针对复调音乐中不同声源的相互干扰而导致同一声源音高序列的不连续,从而降低音高估计精度的问题,提出改进音高轮廓创建和选择的旋律提取算法。算法首先计算时频谱中每一点的音高显著性,并提出基于听觉流线索和音高显著性的连续性创建音高轮廓;为了进一步选择旋律音高轮廓,随后提出根据伴奏的重复特性去除非旋律音高轮廓,主要采用动态时间规整算法计算旋律和非旋律音高轮廓间的相似度;最后,提出利用相邻音高轮廓的长时关系检测旋律音高轮廓中的倍频错误,并平滑旋律音高轮廓形成旋律音高线。在数据集ORCHSET上进行仿真实验,结果表明所提出的改进算法比改进前提高了2.86%的音高估计精度和3.32%的总精度,可有效解决音高估计问题。  相似文献   

20.
方言语音的转换是人机交互领域的一个重要研究课题。为实现普通话到西安话的转换,论文利用《方言调查字表》设计了一个包括文本语料和语音语料的西安方言语料库,录制了普通话和西安话平行的语音语料库。提出了基于归一化非线性多项式的方言韵律转换模型以及基于统计的方言时长转换模型和停顿时长转换模型。利用STRAIGHT算法修改普通话语音,实现普通话到西安话的转换。对转换结果的MOS评测表明,转换后的单字平均MOS得分4.60,双字平均MOS得分为4.75,语句的平均MOS得分为4.15。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号