首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
改进的BIC说话人分割算法   总被引:1,自引:1,他引:0       下载免费PDF全文
郑继明  张萍 《计算机工程》2010,36(17):240-242
针对多人说话改变点检测问题,提出一种改进的BIC说话人分割算法。采用固定窗BIC算法对音频流进行分割,利用基于递归的分割算法和变长窗口的BIC算法确认潜在的分割点。实验结果表明,与其他BIC算法相比,该算法的准确率、召回率和综合性能较高。  相似文献   

2.
随着网络科技的进步,音频分割技术广泛应用于音频检索、语音识别、语义内容分析等领域,对音频深度处理具有重要意义.使用两种基于BIC准则的音频分割算法进行仿真实验,证明滑动窗口的BIC分割算法在广播新闻语料和访谈性质的电话交谈中,检测到的正确音频分割点数目更多,可取得较好的分割效果.  相似文献   

3.
基于小波变换的SAR图像分割   总被引:7,自引:1,他引:7  
SAR(合成孔径雷达)图像包含有相干斑噪声,传统方法不能很好地对SAR图像进行分割,该文结合SAR图像和小波变换多分辨分析的特点,提出了一种新的SAR图像分割方法。首先利用小波变换提取SAR图像的纹理特征信息,然后根据SAR图像噪声在小波域中的分布特点对SAR图像进行滤波,最后以SAR图像小波能量纹理特征和滤波后的灰度组成特征向量对SAR图像进行分割。实验结果表明,该方法是一种有效的SAR图像分割方法。  相似文献   

4.
广播语音的音频分割   总被引:1,自引:2,他引:1  
本文的广播电视新闻的分割系统分为三部分:分割、分类和聚类。分割部分是采用本文提出的基于检测熵变化趋势的分割算法来检测连续语音音频信号的声学特征跳变点,从而实现不同性质的音频信号的分割。这种检测方法不同于传统的需要门限的跳变点检测方法,它是以检测一定窗长的信号内部的每一个可能的分割点所分割的两段信号的信号熵的变化趋势来检测音频信号声学特征跳变点的,可以避免由于门限的选择不当所带来的分割错误。分类部分是采用传统的基于高斯混合模型(GMM)的高斯分类器进行分类,聚类部分采用基于矢量量化(VQ)的说话人聚类算法进行说话人聚类。应用此系统分割三段30分钟的新闻,成功的实现了连续音频信号的分割,去除掉了所有的背景音乐,以较高的精度把属于同一个人的说话语音划归为一类,为广播语音的分类识别打下了良好的基础。  相似文献   

5.
基于小波变换的图像分割研究   总被引:4,自引:0,他引:4  
基于多分辨率分析的图像分割技术是当前图像处理的重要内容,提出了小波变换多分辨率分析方法与改进分水岭分割算法相结合的综合分割方法.此方法利用逐层影射和小波反变换可以得到高分辨率图像,与在原始图像上直接进行传统分水岭分割算法相比较,该方法的实验结果能有效地减少分水岭算法图像过分割现象,经实验证明了该方法的有效性和实用性.  相似文献   

6.
研究 GrabCut 是以迭代能量优化算法为基础,以颜色和纹理为特征,从背景图像中提取出目标的图像分割算法。但该方法速度较慢,为了达到实时应用的目的,提出了一种基于小波变换的 GrabCut 图像分割方法。该方法首先对原始图像进行小波变换的图像压缩,使得原始图像的分辨率降低,然后在压缩后的图像上迭代GrabCut算法,最后将收敛获得的目标区域作为原始图像初始值,再次使用GrabCut算法在原始图像上进行迭代,从而提取出目标。实验结果证明该算法提高了图像目标的提取速度,并保持图像目标的特征基本不变。  相似文献   

7.
在分析了自适应小波变换特性的基础上,提出一种基于自适应小波变换的扩频音频数字水印算法.将二值水印图像降维处理转化为一维序列,再将一维序列与m序列做扩频调制,对音频信号进行分段做自适应小波变换,把经过扩频调制的水印信号经过量化处理嵌入到自适应小波变换后的系数中.模拟实验证明,该方法具有较好的不可感知性和鲁棒性.  相似文献   

8.
《微型机与应用》2017,(5):38-41
解决大规模音频数据库快速检索的有效手段之一是建立合适的音频索引,其中音频分割和标注是建立音频索引的基础。文中采用了一种基于短时能量和改进度量距离的两步音频分割算法,使得分割后的音频片段具有段间特征差异大、段内特征方差小的特点。在音频分割的基础上进行了音频数据库中音频流的标注;分别基于BP神经网络算法和Philips音频指纹算法对音频进行了音频类别和音频内容的标注,为后续建立音频索引表做准备。实验结果表明,两步分割算法能较好地分割任意音频流,音频标注算法能有效进行基于音频类别和音频内容的标注,算法同时具有良好的鲁棒性。  相似文献   

9.
基于小波变换的纹理图像分割   总被引:8,自引:1,他引:8  
基于小波的纹理图像分割方法是把小波变换应用于纹理的特征提取。通过对原始纹理图像进行高阶小波分解,构成每个象素对应一个特征矢量,对所提取的特征利用均值举类算法进行分类,最终获得图像的分割结果。为了提高纹理分割图像的边缘准确性和区域性以及降低分割错误率,提出了利用特征加权来进行后分割的方法。  相似文献   

10.
为达到对数字音频版权保护的目的,利用提升小波变换算法复杂度低、计算速度快的优点,提出一种基于提升小波变换和SVD的音频水印算法。首先对原始音频信号进行分段,为确定水印信息的嵌入位置,选取巴克码为同步信号,并在时域内嵌入子音频段的前端部分;再对子音频段后端部分进行提升小波变换,通过量化调制的方法将水印信息嵌入至信号低频系数的奇异值中。实验结果表明,该算法具有良好的透明性和实时性,对噪声、重采样、裁剪、低通滤波等常见信号攻击表现出较强的鲁棒性。  相似文献   

11.
基于小波变换和支持向量机的音频分类   总被引:2,自引:0,他引:2       下载免费PDF全文
音频特征提取是音频分类的基础,而音频分类又是内容的音频检索的关键。综合分析了语音和音乐的区别性特征,提出一种基于小波变换和支持向量机的音频特征提取和分类的方法,用于纯语音、音乐、带背景音乐的语音以及环境音的分类,并且评估了新特征集合在SVM分类器上的分类效果。实验结果表明,提出的音频特征有效、合理,分类性能较好。  相似文献   

12.
提出了一种基于小波变换和均值偏移的无监督纹理图像分割算法。首先用小波变换对图像进行二级小波分解,然后用均值偏移算法估计出粗尺度上对应的聚类数目,并结合模糊c均值算法进行聚类,在此基础上,用定义的阈值函数和Fisher判据确定出细尺度上每个初始聚类中心的一个同组,从而实现图像的由粗到细的分割。实验结果表明,在分割精度相差不大的情况下,该方法解决了传统聚类方法所存在的需要聚类数目和对初始聚类中心敏感问题。  相似文献   

13.
马尔可夫随机场(Markov Random Field,MRF)理论已经被广泛地应用于视频图像的分割。提出一种基于小波变换的马尔可夫随机场模型的视频对象分割算法。该算法利用小波变换将图像序列分解到小波域,并在此基础上建立马尔可夫随机场模型,构造相应的能量函数。通过迭代求解能量函数的最优解,得出标记场,提取出运动对象。仿真结果表明,该算法能够有效地抑制噪声,提高构成对象边界像素的数量,快速有效地提取出视频对象。  相似文献   

14.
针对胃上皮癌变细胞结构复杂和粘连现象严重的特点,提出了一种将多尺度小波变换和改进的大津法相结合的分割方法.该方法对图像进行多分辨率分解,通过小波分解的高频信息计算出独立峰的个数,利用改进的大津法确定相邻独立峰之间的最优阈值.实验结果表明,该方法具有计算简单、自适应性强、精确度高的优点,能有效地实现胃上皮肿瘤细胞图像的分割.  相似文献   

15.
针对灰度不均匀且含噪声图像的分割问题,提出了全局和局部灰度信息的权重参 数自适应水平集分割模型。首先,利用图像的全局和局部灰度信息构造全局能量项和局部能量 项;然后,利用小波变换和小波阈值去噪方法,构造对噪声不敏感的边缘信息刻画矩阵,定义包含 图像边缘信息的自适应权重系数矩阵;最后,利用定义的权重系数矩阵组合全局和局部能量项, 得到分割模型的能量泛函。使用变分法得到了水平集函数演化方程,利用有限差分法实现数值 求解。实验结果表明,该模型兼有 Chan-Vese 模型和 Local Binary Fitting 模型的优点,能够有效 地分割灰度不均匀含噪图像,并对活动轮廓曲线的初始位置和初始形状具有很强的鲁棒性。  相似文献   

16.
基于小波变换和kd树聚类的快速纹理分割算法   总被引:1,自引:0,他引:1  
提出了一种基于小波变换和k均值聚类的快速纹理图像分割算法。该方法包括特征提取、特征平滑、纹理分割三个阶段。其中,特征提取在金字塔结构小波变换的基础上进行;特征平滑利用一种四分法来完成特征图像的噪声平滑和边缘保持;纹理分割则利用kd树作为数据结构来运行k均值聚类算法从而实现纹理图像的快速分割。实验结果表明与直接的k均值聚类算法相比,该方法在运行时间上得到了明显的提高。  相似文献   

17.
一种基于图像区域分割的小波去噪方法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出一种基于区域分割的图像去噪方法。该方法利用具有平移不变性的DWT去噪法和NeighShrink_ SURE去噪法对平滑图像和纹理图像分别具有良好去噪效果,遂将含噪图像进行区域分割得到平滑、突变和过渡三个区域,最终去噪图像的三个区域分别由两种方法得到的去噪图像加权来确定。实验结果显示,该方法利用了前两种算法的优点,得到了具有较高峰值信噪比、较完整保留图像细节而且具有更佳视觉效果的去噪图像。  相似文献   

18.
针对当前创建语音识别系统时只能采用经验式或启发式方法选择声学模型拓扑结构的情形,提出了一个基于标准遗传算法的声学模型拓扑结构优化算法。与以往的类似应用相比,该算法具备同时优化模型状态数与各状态高斯核数和摒弃高斯核均匀分配的特点。连续数字串TIDigits语料上的以贝叶斯信息准则为目标函数的实验表明,与传统方法创建的基线系统相比,模型拓扑优化的系统能够以较低的复杂度获得较高的识别率,这说明该算法是声学模型拓扑结构优化的有效工具。  相似文献   

19.
提出了一种基于对偶树复小波变换的模糊纹理图像分割算法,该方法包括纹理特征提取和纹理分类两个阶段,其中,特征提取在对偶树复小波变换的基础上进行;纹理分类可以直接用模糊C均值算法进行聚类从而完成纹理的分割,但由于该算法中隶属度函数是基于样本到类中心的距离设计的,这对非球形分布数据很不合理,针对该问题,引入样本与样本的紧致度来度量类中各个样本之间的关系从而修正隶属度函数,并将其用于纹理分类。实验结果表明与模糊C均值算法在运行时间上相差不大的情况下,改进的方法在分割精度、边缘准确性和区域一致性上都得到了明显的改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号