首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
中科院声学所在音频信号处理及人机互动界面语音处理领域取得一系列重要技术成果,并已成功商用。其最新技术涵盖广泛.在音频及语音信号处理领域.包括语音信号的监测、增强.智能声场控制和音频回放技术;在人机互动技术领域,包括语音输入处理任务和音频内容检索等.例如在汽车内等嘈杂环境.能有效抑制噪声、消除回声.实现清晰通话;通过语音识别技术真正实现“闻其声如见其人”的效果。  相似文献   

2.
探讨当前热门的移动增值业务——IVR业务技术组成及语音平台,阐述IVR的基本原理,分析IVR技术的基本构成,设计了IVR平台的两种方案,并在深入分析业务现状后,提出了建设性的意见和增加部分可操作性功能的设想。  相似文献   

3.
音频分类在基于内容的音频、视频检索和分析中起着重要作用。文章针对静音、语音、音乐和环境背景音4类音频提出基于VQ-GMM的分类算法。首先通过阈值判决区分静音和非静音,然后利用VQ-GMM分类器将非静音进而分为语音、音乐和环境背景音。实验结果表明该方法的分类性能良好,平均正确率可达95%。  相似文献   

4.
基于音频相关属性信息进行检索的音乐检索系统具有较大的局限。近年来,基于旋律的音频检索技术的研究成为音频检索技术的热点课题,对单声道音频的旋律特征提取算法作了较深入的研究。本文在分析音乐旋律表达的基础上,研究多声道文件的旋律特征,提出了多声道文件的旋律提取方法,设计完成了面向多声道MIDI格式文件的基于哼唱的音频检索系统。结果表明,系统具有良好的检索功能。  相似文献   

5.
基于音频相关属性信息进行检索的音乐检索系统具有较大的局限。近年来,基于旋律的音频检索技术的研究成为音频检索技术的热点课题,对单声道音频的旋律特征提取算法作了较深入的研究。本文在分析音乐旋律表达的基础上,研究多声道文件的旋律特征,提出了多声道文件的旋律提取方法,设计完成了面向多声道MIDI格式文件的基于哼唱的音频检索系统。结果表明,系统具有良好的检索功能。  相似文献   

6.
基于音乐的特征,分析目前主要的音频检索技术方法,并提出一个音乐检索系统模型,阐述音乐检索的发展前景。  相似文献   

7.
基于直方图的树与链表相结合的音频索引方法   总被引:1,自引:0,他引:1  
采用响度主分量模糊直方图表示音频数据,从而长度不同的两段音频数据,只要长度倍数不超过一定限度,其直方图相似度均能正确反映二者之间的包含关系.在此基础上,提出了二叉树与链表相结合的索引方法,检索时可根据检索目标的长度在索引中选择合适的层次范围搜索.实验结果表明,该索引可大幅度提高检索速度,为基于内容的音频信息检索提供了一种有效的索引方法.  相似文献   

8.
随着高校办公信息的不断增多,传统信息检索系统由于缺乏知识的处理,检索结果很难令人满意;为提高信息检索的查准率和查全率,提出将本体技术应用到信息检索中,研究并构建高校办公信息领域本体,设计了一个基于本体的信息检索系统模型.  相似文献   

9.
概念检索实现的研究   总被引:4,自引:0,他引:4  
文献检索,尤其是网上检索当前基本上都采用基于关键词区配的全文检索技术,但它存在着一定的缺陷。不能完全表达检索者的意图,概念检索是把信息检索与人工智能技术、自然语言处理技术相结合的具有一定智能的检索。通过应用自然语言处理技术初步实现了特定领域的概念检索,探索出一种概念检索模型。突破了关键词检索局限于形式的固有缺陷;并通过对用户检索请求的合理化联想。加强了与用户之间的交互。  相似文献   

10.
文献检索 ,尤其是网上检索当前基本上都采用基于关键词匹配的全文检索技术。但它存在着一定的缺陷 ,不能完全表达检索者的意图。概念检索是把信息检索与人工智能技术、自然语言处理技术相结合的具有一定智能的检索。通过应用自然语言处理技术初步实现了特定领域的概念检索 ,探索出一种概念检索模型 ,突破了关键词检索局限于形式的固有缺陷 ;并通过对用户检索请求的合理化联想 ,加强了与用户之间的交互。  相似文献   

11.
针对哼唱的非精确性,提出一种新的方法,将模糊集合及方法引入旋律近似匹配的过程,在用户查询与数据库目标数据之间构造模糊隶属函数,根据隶属度判断音高差信息的相似度,同时对音长比信息进行相似度计算,用两者加权得分作为动态规划法匹配过程中的转换代价,最终得到两个匹配序列的编辑距离,从而得到查询结果.实验结果显示模糊方法的引入提高了检索命中率,同时考虑音长特征的策略也提高了检索精度.在样本集内,检索结果的前十位命中率较原有的5阶音高差近似匹配方法提高了16%.  相似文献   

12.
为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.  相似文献   

13.
为了对音视频内容进行更加有效地分析,将信息可视化方法引入数字媒体信息处理领域。设计并实现了集多媒体信号采集、大词表连续语音识别、文本检索和音频检索为一身的多媒体内容可视化分析平台,取得了较理想的效果,充实了信息可视化理论并对其具体应用进行了有益尝试。  相似文献   

14.
为了高效的进行商标设计,提出了基于内容的商标检索算法.首先应用Zernike矩描述图像的形状信息,并将手绘图作为查询条件进行检索,依据形状距离进行排序,将排序结果作为第一轮检索结果输出.其次,用户对第一轮检索结果进行标注,并将标注结果反馈给系统,通过分类器学习后,再次进行检索并输出最终检索结果.实验结果表明,提出的算法在商标图像的检索中具有检索准确率高、耗时少的特点;此外,算法可支持用户以手绘的方式进行查询,有一定的实用价值.  相似文献   

15.
基于全局运动的视频检索方案   总被引:1,自引:0,他引:1  
提出了一种基于全局运动的视频检索方案.对活动图像专家组(MPEG)视频进行全局运动分析,较精确地提取出摄像机的运动模型,将模型参数构成特征点序列,采用顺序匹配的方法进行示例检索;还根据全局运动参数构造了运动分析函数,对视频进行了准确的全局运动分割和语义注释,并以此为基础,利用可扩展标记语言(XML)描述了视频的全局运动,测试了基于Xquery的语义查询.试验结果表明,在风景类视频中,该方案实现了一定程度的语义检索,较同类检索方案查询效率得到了提高.  相似文献   

16.
本文讨论了概率模型的新闻资料全文检索及排序算法。作者提出了全文检索最佳排序原则。根据Neyman-Pearson决策规则导出了最优检索规则,并据此提出了BI概率模型和相应的最优查询。根据用户对被检索文献作出的相关判断,对构造BI模型的最优查询所需参数进行了估计。最后,提出了基于概率模型的全文检索排序算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号