期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 总被引：1，自引：0，他引：1

吕国云蒋冬梅张艳宁赵荣椿 Hichem Sahli 《西北工业大学学报》2008,26(2):173-178

提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states Dynamic Bayesian Network, SM-DBN)模型,以实现大词汇量连续语音识别和音素切分.该模型在Bil m es等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network, Phone-sh ared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接.它的识别基元为音素,描述了音素的动态发音变化过程.大词汇量语音识别的实验结果表明:在纯净语音环境下 ,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%. 相似文献

2.

多路AVS+视频解码系统的设计

袁三男杜小敏《上海电力学院学报》2017,33(1):86-90

为更有效地保障数字电视系统的兼容性,数字电视监测系统需要能够解码国内市场上出现的各种标准的数字视频流.设计了基于海思Hi3716MV310的多路AVS+(Audio and decoding standard+)视频解码系统.分析了各种市场应用领域中存在的主流标准,选择了海思Hi3716mv310为解码芯片进行硬件和软件的设计;并在数字电视监测系统中进行多标准的视频流的解码.实验结果表明,该系统可成功解出多种标准的音视频码流,尤其是AVS+标准的码流,具有较高的应用价值. 相似文献

3.

基于H.264运动估计的音视频同步编码技术

李晓妮陈贺新陈绵书蒙塞夫·嘎博基《吉林大学学报(工学版)》2012,42(5):1321-1326

提出了一种在H.264运动估计过程中嵌入音频的音视频同步编码方法,利用1/4像素精度的运动搜索,解决了音视频同步编码问题。在发送端,根据1/4像素搜索点和音频的对应关系,在1/4像素运动估计过程中通过调整最优匹配点将音频压缩流嵌入视频中,然后对嵌入音频的视频流进行压缩编码。在解码端,根据嵌入准则,提取音频信息,再对音频和视频信号进行重构和恢复。实验表明,本文方法在不增加音视频压缩数据量、在音视频质量下降较小的情况下,实现了音视频同步压缩编码和传输。相似文献

4.

在接收端实现流媒体同步控制的方法

赵淑兰宋人杰李广仁《东北电力学院学报》2010,30(2)

本文提出了一种在RTP/RTCP协议的基础上实现流媒体同步控制的方法。该方法通过在接收端设置合适大小的缓冲区,实现媒体内的同步;通过以音频流为主媒体流,视频流为从媒体流,结合媒体流在接收端缓冲区的占用率,比较音频帧和视频帧的播放时间戳,对视频帧采取重复/丢弃方式来取得音视频媒体间的同步。实验表明,该种方法既保证单个媒体流的平滑播放,又能实现音视频的媒体间同步。相似文献

5.

基于H.264的嵌入式音视频同步编码技术

李晓妮陈贺新孙元陈绵书刘添《吉林大学学报(工学版)》2011,41(5):1475-1479

提出了一种在H.264帧间预测过程中嵌入音频的音视频同步压缩编码方法,利用H.264中匹配块的尺寸可变性,解决了音视频同步编码问题。在发送端,根据编码准则,不同尺寸的匹配块携带不同的音频信息,通过对匹配块的选择将音频压缩流嵌入视频中,然后对嵌入音频的视频流进行压缩编码。在解码端,根据嵌入准则,提取音频信息,再对音频和视频信号进行重构和恢复。实验表明,本文方法在一定开销内,视频质量下降较小的情况下,实现了音视频同步压缩编码和传输。相似文献

6.

一种新的媒体同步反馈控制算法

吴炜常义林罗忠《西安电子科技大学学报(自然科学版)》2006,33(3):359-365

提出一种新的媒体同步反馈控制算法．该算法检测播放缓冲区的占用水平．发现失步时通过反馈的方式改变发送端媒体流的发送帧率．补偿时延抖动和网络异常，实现媒体内同步．在音频流和视频流保持媒体内同步的基础上．接收端同步启动播放音视频．从而达到媒体间同步．实验结果表明．该算法在不增加播放时延的情况下可以显著地降低媒体单元丢失率．保证单个媒体流的平滑播放．并实现音视频的媒体间同步．相似文献

7.

一种基于非实时操作系统的数字视频传输方法

杨晓君苗彦超郭黎利孙凝晖《哈尔滨工程大学学报》2005,26(6):777-780

视频服务器是非实时音视频节目的存储和播控设备,在非实时操作系统中,视频服务器改变了PCR在原始传送流中的时域位置,造成PCR抖动.对视频服务器来说,输出传送流的PCR校正是必须的.文章在分析影响MPEG-2系统同步因素的基础上,提出了解决非实时操作系统处理实时传输应用的积分流控模型和包近似等间距传输算法,并进行了视频服务器实时传输性能分析,实验结果证明该模型与算法是实用有效的,是高性能计算机处理实时音视频传输的理想解决方案. 相似文献

8.

基于Flash Media Server的视频教学系统的设计与实现

盛小清吴伟信《佳木斯工学院学报》2011,(5):722-725

针对目前网络教育的实际情况,分析网络教学系统建设需求的基础上,论述了一个基于Flash Media Server技术的网络视频教学系统的总体设计.以.NET和Flash Media Server技术为支撑,对系统中＂音视频录制和直播＂、＂观看音视频流＂、＂视频文件上传＂、＂双向视频交流＂等核心功能模块进行了详细的分析,提出了合理的解决方案.为学生提供了可视化、直观的视频课程平台,极大增强了客户端的用户体验感,减轻了服务器的压力,展现了Flash Media Server技术在视频教学中的强大优势. 相似文献

9.

基于多元变量泰勒级数展开模型的定位算法

夏斌刘承鹏孙文珠李彩虹《电子科技大学学报(自然科学版)》2016,45(6):888-892

传统Taylor级数展开模型只考虑未知节点和锚节点之间的距离,没有考虑未知节点之间的距离,定位信息不够全面,从而导致定位精度不高。为了进一步提高定位精度,该文提出了一种新的基于多元变量Taylor级数展开模型的定位算法。首先考虑未知节点之间的距离信息,建立新的基于多元变量Taylor级数展开的定位模型。然后,在对新的定位模型求解过程中,采用粒子群算法对未知节点进行定位,获得其位置的初始值。再根据加权最小二乘法求出新模型的解,作为未知节点的估计位置。最后,为评价该算法的性能,对定位结果的克拉美罗界（CRLB）进行推导。仿真结果表明基于多元变量Taylor级数展开模型的定位精度更高,定位误差接近CRLB。相似文献

10.

PageRank模型在中文情感词极性判别中的应用 总被引：1，自引：1，他引：0

李荣军王小捷周延泉《北京邮电大学学报》2010,33(5):141-144

针对倾向性分析任务重的基础性工作——情感词的极性判断工作,提供了一种基于PageTank模型的情感词极性判断方法.由待判别情感词和少量中子情感词构成图中的节点,利用知网（HowNet）语义资源计算词语间的语义想死度,进而得到图中节点间边的权重.通过PageRank模型的引入,综合利用有标种子情感词和无标待判别情感词实现对无标情感词的极性判别.与传统的基于HowNet的情感词判别方法相比,PageRank模型的引入使情感词判别的准确率平均提高10%左右,充分验证了所提方法的可行性. 相似文献