首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
在分析应用视频数据的过程中,视频分段是分析,组织,应用视频数据的基础。由于视频数据的多样性,传统的分段方法不能给出令人满意的结果,一般需要通过人机交互来进行。文中将较为成熟的文本分析、语音处理、图像处理三种技术进行综合,互为补充,对视频流进行分割。文本分析的对象是语音转换成的文本、标题、注释等。语音处理包括语音识别和语音信号分析。语音识别将视频中的自然语言转换为文字。语音信号分析对视频材料中的语音成分进行基础分析。图像处理主要用来处理视频中的图像部分。文章阐述了视频流的分段层次,文本分析,语音处理算法以及镜头突变,镜头渐变识别算法的思想。  相似文献   

2.
黑寡妇 《电脑》2004,(10):85-86
所谓音频无损压缩,是指在压缩原始的PCM音频的过程中不损失任何音质的压缩方式,当我们播放这类音频格式时可以得到和PCM原文件相同的音质。这类格式在保持PCM音频音质的同时,拥有比它小得多的体积,因此,它既便于通过网络的传播,更有利于欣赏。从本期开始我们将分两期对几种主要的无损压缩音频格式进行介绍,并进行对比测试。  相似文献   

3.
AVICAP窗口类是完成从视频源中获取数据,并按照需要的格式进行存储、转换的重要手段,它提供的主要功能包括:①动态了解视频和音频的输入设备;②设置视频捕获速率;③提供设置视频源、视频格式以及是否采用视频压缩的对话框;④采用实时叠加和预览方式显示视频图像;⑤实时获取每一帧数字视频数据;⑥将音频、视频流直接压缩人AVI文件;⑦捕获某一帧的视频数据,  相似文献   

4.
本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注  相似文献   

5.
在视频会议系统中还有日常拍摄处理视频时,需要利用视频转码技术对传统和新兴视频流进行格式转换。使用转码的意义在于可以在不损失任何视频质量的前提下节省高达50%的网络带宽。转码的分类按照媒体格式可分为音频转码、视频转码,视频转码比较出名的有暴风转码、格式工厂,音频转码用大众的千千静听就能满足使用需要。本文以转码应用为研究对象,进一步分析软件转码技术的应用。  相似文献   

6.
制作手机铃声需要音频转换工具、压缩工具、分割工具等等软件。那么,有没有像视频软件“暴风影音”那样的集各种格式为一体的功能强大的音频软件呢?答案是肯定的,GoldWave就是这样一款软件,它不但支持各种音频格式之间的转换、压缩、分割,同时它也是制作各种格式手机铃声的基础工具类软件。  相似文献   

7.
多媒体技术在视频领域中的应用   总被引:2,自引:0,他引:2  
本文介绍了多媒体技术在视频领域中的应用,如视频信息的数字化转换、视频信息的编辑、压缩以及视频和音频信号在输入输出过程中同步的问题。  相似文献   

8.
基于乘积HMM的双模态语音识别方法   总被引:3,自引:2,他引:1       下载免费PDF全文
针对噪声环境中的语音识别,提出一种用于双模态语音识别的乘积隐马尔可夫模型(HMM)。在独立训练音频HMM和视频HMM的基础上,建立二维训练模型,表征音频流和视频流之间的异步特性。引入权重系数,根据不同噪声环境自适应调整音频流与视频流的权重。实验结果证明,与其他双模态语音识别方法相比,该方法的识别性能更高。  相似文献   

9.
前不久,豪杰公司推出《超级解霸V9》测试版。其中新提出的DAC音频格式(本文以下简称“DAC”)颇受关注.软件还提供了一套与其相关的格式转换及音频制作工具。那么.DAC是怎样的技术?有怎样的特点?我们如何制作DAC格式的音频文件呢?  相似文献   

10.
利用DirectShow技术实时捕捉视频流中的图像帧   总被引:5,自引:0,他引:5  
胡涛  刘睿  张志刚 《计算机应用》2003,23(Z1):211-213
介绍了在Windows平台上使用DirectShow构造图像捕捉过滤器获取视频流中图像帧数据的方法.该方法不受视频流格式和压缩标准的限制,具有实时在线的特点;同时由于该方法中回调函数的设计,使用户能够利用它方便的对视频进行实时在线的分析处理,因而它在视频分析应用中具有重要的应用前景.  相似文献   

11.
戴馨  白新跃 《福建电脑》2006,(5):137-137,171
针对广电系统中,素材采集环节与编辑环节所使用音频格式不同的问题,用软件的方式完成PCM与MP2格式的相互转换。可作为独立的音频转换软件,也可作为如Audition等编辑软件的插件。  相似文献   

12.
模拟音频信号经过数字化后,会产生很大的数据量,不适合存储和传输的需要。数字音频的压缩编码已经成为一门非常重要的技术。该文主要介绍数字音频信号的常用压缩编码方法,如MPEG-1、MPEG-2、AC-3数字音频压缩编码标准,并阐述了各自的性能特点及应用领域。然后结合应用软件——Delphi,介绍制作音频播放器的过程,并利用音频播放器实现mp3等格式音频文件的播放。  相似文献   

13.
《计算机应用文摘》2005,(C00):64-71
音乐具有忧美的旋律,而且具有神奇的魔力,相信没有哪位朋友对动听的音乐无动于衷。但是音频格式种类繁多,不同的格式其音乐的品质也有不同。为了使音乐的欣赏品质能得到更好的还原以及方便保存已有的音频文件,一些用户想实现在各类音频文件之间的转换。本切内容将多种实用的音频转换软件介绍给广大用户,从而方便不同用户对音乐格式的不同要求。[编者按]  相似文献   

14.
为了探讨高斯混合模型在说话人识别中的作用,设计了一个基于GMM的说话人识别系统。整个系统由音频信号预处理,语音活动检测,说话人模型建立以及音频信号识别4个模块组成。前三个模块构成了系统的模型训练部分,最后一个模块构成了系统的语音识别部分。包含在第二个模块中的由GMM模型搭建的语音活动检测器是研究的创新之处。利用增强的多方互动会议语料库中的视听会议对系统中的部分可调参数以及系统的识别错误率进行了测试。仿真结果表明,在语音活动检测器和若干滤波算法的帮助下,系统对包含重叠语音的音频信号的识别准确率可以达到83.02%。  相似文献   

15.
语音信号是一种时变、非平稳的随机信号。现有语音识别系统的适应性比较差,尤其在高噪声环境下的语音识别非常困难,若将语音识别系统商品化,还有识别速度、拒识问题以及关键词/句检测技术等细节问题需要解决。如何把语言学、生理学、心理学方面的研究成果量化、建模并用于语音识别,还需深入研究。本文介绍了语音识别中小波分析的研究现状及几种常见的技术方法,并且分析探讨了语音识别中小波分析的应用和发展前景。  相似文献   

16.
多媒体技术在人们日常生活中的应用越来越广泛,图像、视频、音频等多媒体数据逐渐成为信息处理领域中主要的信息媒体形式。视频捕获技术是信息处理中的重要环节,研究该项技术具有重要的实用价值。文章提出一种基于VFW的远程视频捕获方法。该方法利用VFW捕获视频数据,采用H.263编码标准压缩视频数据,利用面向连接协议的流式套接字实现实时视频流的传输,结合多线程技术实现视频文件播放。然后,基于Windows操作系统设计实现了远程视频捕获系统。实验结果表明,该方法CPU占用率低、内存占用小,可靠性强,具有较好的应用价值。  相似文献   

17.
本文介绍了语音识别系统芯片国产替代方案的实现.语音识别系统的硬件核心芯片采用富芮坤FR8016HA,系统接收由移动端通过蓝牙发送来的音频信号,之后对语音信号进行识别,最终将识别结果呈现到LCD显示屏上,实现人机交互.语音算法采用改进的DTW模板匹配法,通过测试,本系统语音识别正确率可达82%.  相似文献   

18.
现在最流行的音频格式就要属MP3、WMA了,不过网上也经常出现一些APE、TTA或FLAC等常见的无损压缩音频文件,这些音频文件的音质虽好,但体积过大,而且大部分的MP3随身听都不能识别这些格式,今天我们的目标就是在尽量保留它们原有音质的条件下,将这些文件转换为MP3格式。  相似文献   

19.
随着宽带网络的普及,号称无损压缩的APE音频文件也越来越多地出现在各大论坛和BT下载站点的音乐版块中。APE格式是喜欢在计算机上尝试HIFI的朋友们所钟爱的一种音频格式.它提供了无损的音频压缩和实时音频解码。在计算机上使用时,这种编码格式无疑提供了最好的音质和非常方便的使用性。但笔者所使用的MP5播放器却不能支持这种格式,这样外出时就无法欣赏这种美妙的音乐了,不过利用Monkey’s Audl0与Lame编码器.咱们就可轻松将APE音乐转换为高品质的MP3音乐:  相似文献   

20.
上行流媒体在军民融合领域展现出日益重要的新兴战略价值,压缩感知视频流技术体系在上行流媒体应用中具有前端功耗低、容错性好、适用信号广等独特优势,已成为当前可视通信研究的前沿与热点之一。本文从阐述上行流媒体的应用特征出发,从性能指标、并行分块计算成像、低复杂度视频编码、视频重构和语义质量评价等方面,分析了当前针对压缩感知视频流的基础理论与关键技术,对国内外相关的研究进展进行了探究与比较。面向上行流媒体的压缩感知视频流面临着观测效率难控、码流适配困难和重建质量较低等技术挑战。对压缩感知视频流的技术发展趋势进行展望,未来将通过前端与智能云端的分工协作,突破高效率的视频观测与语义质量导引视频重构等关键技术,进一步开拓压缩感知视频流在上行流媒体应用中的定量优势与演进途径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号