首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
基于音频相关属性信息进行检索的音乐检索系统具有较大的局限。近年来,基于旋律的音频检索技术的研究成为音频检索技术的热点课题,对单声道音频的旋律特征提取算法作了较深入的研究。本文在分析音乐旋律表达的基础上,研究多声道文件的旋律特征,提出了多声道文件的旋律提取方法,设计完成了面向多声道MIDI格式文件的基于哼唱的音频检索系统。结果表明,系统具有良好的检索功能。  相似文献   

2.
本文我们介绍了AC-3编码算法特点和编、解码原理,并详细推导了用于计算改进离散余弦变换(MDCT)的快速算法。  相似文献   

3.
哼唱检索是音频检索的一个重要分支,其能够为用户提供一种方便快捷的全新体验.在检索过程中,由于同首歌的不同哼唱版本之间具有不容忽视的差异,因此对旋律特征进行精确匹配并无法得到理想的检索结果.针对这一问题,将基于优化初始聚类中心的k-means(optimized in-itial clustering center k-...  相似文献   

4.
基于内容的遥感图像检索综述   总被引:5,自引:0,他引:5  
随着遥感图像数量的急剧增加,基于内容的遥感图像检索系统逐渐成为了一个研究热点。系统地介绍了该领域各个方面研究的现状。首先给出了遥感图像内容检索系统的基本结构和查询策略。其次,结合遥感图像的特点,着重介绍了基于纹理、形状、结构特征相似性比较等方面的内容,针对这些方面的研究所存在的问题提出了见解,介绍了所研究成果,并对今后的工作进行了展望。  相似文献   

5.
基于内容的医学图像检索技术   总被引:1,自引:0,他引:1  
介绍了基于内容的医学图像检索系统的意义、方法和关键技术,分析了国内外医学图像检索领域的应用现状,并在此基础上探讨了基于内容的图像检索技术在医学图像检索领域的应用前景和未来的发展方向。  相似文献   

6.
针对哼唱的非精确性,提出一种新的方法,将模糊集合及方法引入旋律近似匹配的过程,在用户查询与数据库目标数据之间构造模糊隶属函数,根据隶属度判断音高差信息的相似度,同时对音长比信息进行相似度计算,用两者加权得分作为动态规划法匹配过程中的转换代价,最终得到两个匹配序列的编辑距离,从而得到查询结果.实验结果显示模糊方法的引入提高了检索命中率,同时考虑音长特征的策略也提高了检索精度.在样本集内,检索结果的前十位命中率较原有的5阶音高差近似匹配方法提高了16%.  相似文献   

7.
基于模糊聚类表征的音频例子检索及相关反馈   总被引:10,自引:0,他引:10  
避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,直接从原始音频流中提取压缩域特征,使用时空约束机制进行压缩域特征的模糊聚类,用聚类结果的质心来表征整个音频例子,基于聚类质心完成相似度匹配,实现基于非监督机制的音频例子快速检索.并在检索过程中引入相关反馈,根据用户对检索结果的相关反馈调整检索结果,使其与用户的感官相似一致.实验结果表明,此种方法可以达到快速检索的效果,检索准确率可达85%以上.  相似文献   

8.
针对静态图象的特性 ,介绍了一种可以在 C语言环境下读取 BMP文件的方法 ,用这种方法 ,可以得到不同位图像素值的 BMP图象的每一个像素点的信息 (即 R,G,B)。在分析了几种典型的颜色和纹理特征提取算法的基础上 ,通过转换成不同的颜色空间 ,利用基于颜色和基于纹理的图象检索算法 ,提取该图象的颜色和纹理特征。并用不同的量化方法对图象的特征提取的效率进行了分析  相似文献   

9.
主要从图像纹理特征入手,研究如何有效地抽取图像纹理特征对图像进行描述,基于抽取的特征对图像进行搜索,从而提高检索效率和检索性能。  相似文献   

10.
对硅藻细胞分类提出了一种基于内容的分类方法。该方法首先获取带外接圆的目标;然后,对其应用纹理主特征直方图,纹理变化度,纹理角特征3种方法提取出目标的特征向量;最后使用欧氏距离进行相似性度量。实验结果表明,该方法具有较好的分类准确率及召回率。  相似文献   

11.
脉冲耦合神经网络是新一代的人工神经网络,具有优良的自适应图像分割和自适应图像特征提取能力。本文有机的运用自适应图像分割和自适应图像特征提取,提出了一种新的图像特征———空间自适应类直方图,它既包含了图像的空间位置特征,又包含了图像的灰度特征。最后,我们把空间自适应类直方图与传统的基于共生矩阵的图像纹理特征组合作为图像的特征应用于图像检索。大量实验表明本文方法的有效性。  相似文献   

12.
基于深度特征聚类的海量人脸图像检索   总被引:1,自引:0,他引:1  
针对海量人脸图像数据库检索时长的问题,提出了一种基于深度特征聚类的海量人脸图像检索算法.该算法首先使用人脸图像训练集对深度卷积神经网络模型进行人脸图像分类训练,在此基础上采用三元组损失方法对已训练好的人脸图像分类网络模型进行微调,使得网络能够更加有效地提取人脸图像的高层语义特征,构建更具有表征性的人脸图像深度特征.其次采用K-means聚类算法对提取的人脸图像深度特征进行聚类,使得同一个人的人脸图像能够划分到同一簇中,然后在相应的簇中进行人脸图像的深度特征相似度匹配执行人脸图像检索任务.为了进一步提高系统的检索性能,提出人脸图像深度特征融合的查询扩展方法,对待检索的人脸图像深度特征进行融合再次执行检索任务得到最终的检索结果.通过在两个人脸检索数据集(Celebrities Face Set和Labeled Faces in the Wild dataset)上进行详尽实验验证,结果表明,该算法能极大地缩小海量人脸图像数据库的检索范围,在保证一定准确率的前提下有效地提高了人脸图像检索的速度.  相似文献   

13.
针对传统单点流量测量风速已经不能满足要求的问题,提出了基于MCU的多通道风速计设计与实现,阐述了硬件、软件实现方法。实验结果表明,该方法可以准确测量出8个通道的风速值,测得的风速精度高,稳定性良好。  相似文献   

14.
针对基于兴趣点的传统图像检索方法的不足,提出了一种利用兴趣点检测和空间区域划分的图像检索新方法。首先使用一种结合SIFT和Harris特性的尺度空间兴趣点检测算法(IPDSH)来检测图像的稳定兴趣点;然后利用稳定兴趣点的空间位置对图像进行环形和凸包区域划分,并计算凸包内的颜色直方图和环形区域中稳定兴趣点邻域内伪泽尼克矩;最后以两种特征的加权特征向量对图像进行检索。该方法实现简单,检索速度快,能保证检索算法对图像旋转、平移的鲁棒性,且有效减少了图像中不稳定兴趣点对检索带来的干扰,图像检索的准确度有效提高了7.0%~15.1%。  相似文献   

15.
在分布式模拟训练系统中,语音系统的设计通常采用专用硬件的手段实现,该方法不仅增加了系统设计的费用和复杂度,也增加了系统硬件组成和布局的难度.设计了一种分布式环境下的基于软件化的实时语音通信系统,利用DirectX对语音数据进行采集和回放,并以网络通信的方式对数据进行打包、传输和解包.同时,针对噪声等周围环境和无人说话时产生的冗余数据造成网络通信量增加的问题,采用离散傅里叶变换对语音信号在频域进行过滤,有效降低了系统的网络负担.该系统在某型模拟器中得到了较好的应用.  相似文献   

16.
多媒体实时应用是未来Internet上的重要业务之一,针对IP电话和多点音会议,本文提出了一种基于单播和组播的,混合通信方式语音实时通信系统的实现方法,着重介绍了系统结构设计,语音编码、通信及相关控制技术。多次实验表明,系统在Intraent上运行情况良好。  相似文献   

17.
基于HIS颜色空间颜色对的图像检索系统   总被引:2,自引:0,他引:2  
提出了一种在HIS空间中进行的基于颜色对的图像检索算法.为突出颜色在画面中的位置在内容检索上的作用,算法在HIS颜色空间的上对各颜色分量进行量化,用颜色对来描述图像的颜色特征,定义了基于颜色对的相似度度量,利用图像颜色特征进行相似度匹配和检索.实验结果表明,该算法能比较快速、有效地针对图像内容进行检索.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号