排序方式: 共有86条查询结果,搜索用时 15 毫秒
51.
研究中文发音过程中舌头运动的3D可视化问题。根据核磁共振数据构建舌头精细的3D模型,在此基础上,提取舌背表面处3个点的EMA数据为驱动源,利用弹簧网技术真实再现中文发音过程中的舌头运动。为了验证文中建模和舌头运动合成方法的有效性,使用计算机图形学的方法模拟舌头运动的细节效果,并对比其与由语言学家亲自拍摄的“普通话发音器官动作特征”的X光影像。实验表明,文中方法实现的3D舌头运动符合真实的舌头运动情况,拥有广泛的应用前景。 相似文献
52.
鉴于数据在不可靠信道传输时,可能会发生数据包丢失或出错的问题,因此在图像与视频信号传输中如何解决由此而产生的图像质量严重下降问题已成为近年来的一个重要研究课题,而多描述编码作为一种可选的解决方案已开始受到关注。由于多描述编码是将信号分解为多个独立的码流,并通过不同的信道进行传输,因而可在较高压缩效率下增强信号的稳健性。在对目前的图像多描述编码文献进行分析和综合的基础上,首先阐述了多描述编码的历史和信息论背景;然后对图像多描述编码方法进行了分类,即分为基于量化、基于变换和基于空间扩展的多描述编码等几类,并对各种方法的数学模型以及适用情况等进行了讨论;最后给出了图像多描述编码的存在问题及研究展望。 相似文献
53.
提出一种单幅图像中的人体检测方法.该方法用隐马尔可夫模型表示人体,根据给定的人体结构序列估计产生该序列的图像区域,从而将人体检测问题转化为隐马尔可夫解码问题求解.首先对图像进行Mean-Shift分割,并根据颜色信息搜索出属于躯干的区域,然后将明暗度、颜色及边缘3种底层特征相结合,估计特征匹配概率并由此获得四肢部分的候选区域.最后估计候选区域的连接概率并利用隐马尔可夫解码算法找出最优的人体配置区域.实验结果表明,该方法对于复杂背景中具有不同姿态的人体图像可得到较满意的检测结果.和其它检测方法相比,该方法并非单纯地给出矩形近似的人体各个部分,同时还获得较完整分割的人体图像.尤其对于图像分辨率较低、图像中的人体较小且存在运动模糊的情况,该方法能够获得较好的检测结果. 相似文献
54.
基于塔式格型矢量量化的图像多描述编码算法 总被引:6,自引:0,他引:6
多描述编码(MDC)是解决差错信道上图像通信数据包丢失问题的一种新方法,它通过将图像分解为多个独立而又具有一定相关性的描述,并通过不同的信道进行传输,来改善数据丢失条件下的图像解码质量。本文提出了一种图像信号的多描述塔式格型矢量量化编码算法(MDPLVQ),利用小波树之间的独立性,采用不同的塔式格型矢量量化缩放因子对小波系数进行量化。该算法设计简单,对冗余度的控制容易,实验结果说明了其有效性,其编码压缩性能优于多描述标量量化(MDSQ)、多描述对变换(MDPCT)和多描述零又树(MDEZW)等方法。 相似文献
55.
提出一种基于种子区域增长的快速图像分割方法.该算法首先对输入彩色图像进行色彩量化处理.然后根据图像中量化色彩标签的分布情况,通过设置不同尺寸的图像窗口快速寻找种子区域,并结合图像中的色彩和纹理特征,实现种子区域的快速增长.实验结果表明,本文所提出的图像分割算法在计算时间和分割效果上均有较好性能,特别适用于基于内容的图像检索等应用. 相似文献
56.
提出了一种基于数据驱动的语调建模方法.该方法采用主成分分析 (Principal component analysis, PCA) 技术, 给出了特征语调, 统计了语音情感模式在特征语调空间中的分布规律, 经过分析得出了普通话中情感模式所对应的情感语调.针对语音产生的机理复杂、语音语调受众多因素影响的特点, 为了避免这些干扰因素的影响, 设计了相应的情感语音库.利用所设计的语音库, 进行了相关实验.实验结果表明, 利用所提出的特征语调模型不仅能够非常完美地重构出语调样本的语调, 而且具有相当的情感表达能力. 相似文献
57.
分析了驻极体传声器的电路模型及其传统的前置放大电路。介绍了一种电流模驻极体传声器前置放大器,该放大器放大传声器的电流信号,利用低频负反馈阻止了传声器的直流信号进入放大器。相对于传统前置放大器,电流模前置放大器有更强的抵抗噪声性能。 相似文献
58.
为了快速合成真实感强的口型,在Waters肌肉模型的基础上,提出了一种新的唇区肌肉模型,弥补了Waters模型对于唇区肌肉的较复杂运动描述不完全的不足。该模型以面部解剖学为基础,通过面部运动的解剖学机理的研究,将唇区的整体运动表示为若干个子运动的线性组合。该模型可用于语音驱动的动画合成。此时,只需在说话人的唇区标定少数几个特征点,就可以获得一组唇区肌肉参数,进而建立相应的肌肉模型。借助于该模型,可以在唇区附近的线性肌的联合作用下,合成说话时的各种口型。实验结果表明,该肌肉模型不仅计算代价小,且合成的口型真实感较强,具有很强的实用性。 相似文献
59.
王 《模式识别与人工智能》2006,19(2)
以格式塔心理学原理、视觉组织规则和静电场理论为参考,提出一个基于静电修复场的补全模型来解决立体视觉中的感知修复问题.在该模型中,定义用于产生修复场的激发子及其安置规则.该修复场能够自然地将轮廓片段的断点进行匹配并且用合适的光滑曲线进行连接修复,从而得到与人类的感知结果相一致的修复结果.修复结果用于重构存在遮挡和错觉轮廓的三维场景,能够得到正确的深度估计和分割. 相似文献
60.
该文提出一种使用声压幅度比进行声源定位的方法。该方法从接收阵列各拾音器所接收之电压信号的幅度与相应拾音器到待测声源的距离两者之间存在的关系出发,给出了以声压幅度比为参量的约束条件的表达式,建立了利用这些约束条件进行声源定位的算法。为了验证方法的有效性,进行了计算机仿真实验。结果表明本文提出的定位方法简单、快捷,具有较高的定位精度。 相似文献