首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
为了实现手语视频中手语字母的准确识别,提出了一种基于DI_CamShift和SLVW的算法。该方法将Kinect作为手语视频采集设备,在获取彩色视频的同时得到其深度信息;计算深度图像中手语手势的主轴方向角和质心位置,通过调整搜索窗口对手势进行准确跟踪;使用基于深度积分图像的Ostu算法分割手势,并提取其SIFT特征;构建了SLVW词包作为手语特征,并用SVM进行识别。通过实验验证该算法,其单个手语字母最好识别率为99.87%,平均识别率96.21%。  相似文献   

2.
杨全  彭进业 《计算机工程》2014,(4):192-197,202
为有效识别手语字母,提出一种手语视觉单词(SLVW)的识别方法。采用Kinect获取手语字母视频及其深度信息,在深度图像中,通过计算获得手语手势的主轴方向角和质心位置以调整搜索窗口,利用基于深度图像信息的DI_CamShift方法对手势进行跟踪,进而使用基于深度积分图像的Ostu方法分割手势,并提取其尺度不变特征变换数据。将局部特征描述子表示的图像小区域量化生成SLVW,统计一幅手语图像中的视觉单词频率,用词包模型表示手语字母,并用支持向量机进行识别。实验结果表明,该方法不受颜色、光照和阴影的干扰,具有较高的识别准确性和鲁棒性,对复杂背景手语视频中的30个手语字母的平均识别率达到96.21%。  相似文献   

3.
为实现视频中手语的准确识别,提出一种基于深度图连续自适应均值漂移(DI_CamShift)和加速强健特征词包(SURF-BoW)的中国手语识别算法.该算法将Kinect作为手语视频采集设备,在获取彩色视频的同时得到其深度信息.算法首先计算深度图像中手语手势的主轴方向角和质心位置,通过调整搜索窗口对手势准确跟踪;然后使用基于深度积分图像的OTSU算法分割手势并提取其加速强健特征(SURF),进而构建SURF-BoW作为手语特征并使用SVM识别.通过实验验证该算法在单个手语字母上的最好识别率为99.37%,平均识别率为96.24%.  相似文献   

4.
采用SIFT-BoW和深度图像信息的中国手语识别研究   总被引:1,自引:0,他引:1  
杨全  彭进业 《计算机科学》2014,41(2):302-307
将深度图像信息引入手语识别的研究,提出了一种基于DI_CamShift(Depth Image CamShift)和SIFT-BoW(Scale Invariant Feature Transform-Bag of Words)的中国手语识别方法。该方法将Kinect作为视频采集设备,在获取手语彩色视频的同时得到其深度信息;首先计算深度图像中手语手势的主轴方向角和质心位置,通过调整搜索窗口对手势进行准确跟踪;然后使用基于深度积分图像的Ostu算法分割手势并提取其SIFT特征,进而构建SIFT-BoW作为手语特征并用SVM进行识别。实验结果表明,该方法单个手语字母最好识别率为99.87%,平均识别率96.21%。  相似文献   

5.
为实现基于Kinect的手语识别,提出了一种利用有限状态机及动态时间规整(DTW)的动态手语识别方法。首先,利用Kinect技术得到人体深度图像和骨骼特征信息;然后利用手部分割算法得到手部深度图像,再选取识别正确率高的梯度方向直方图(HOG)特征算子来提取手部特征;最后加入有限状态机和DTW算法实现动态手语识别。实验结果表明:该方法能够实现对常用手语单词、句子的识别,识别准确率可达95%。  相似文献   

6.
基于视觉的手势识别是实现新一代人机交互的关键技术。通过手势识别向屏幕输入文字以供搜索查找的系统基本没有,在现有的手势识别基础上,利用汉语字母和数字对应的手语作为输入手势,采用微软的kinect获取深度图像,对其进行手势分割。通过Canny算法提取手势的边缘,利用小波矩提取特征,得到手势字母,实现了具有手势识别以及基于文字输入功能的系统。实验表明该系统能够准确有效地实现汉字的输入。  相似文献   

7.
提出一种基于彩色-深度视频和复线性动态系统(Complex linear dynamic system, CLDS)的手语识别方法,可以保证时序建模数据与原始数据严格对应,准确刻画手语特征,从而显著提高分类精度。利用深度视频补偿RGB视频中的缺失信息,提取手语视频运动边界直方图(Motion boundary histogram, MBH)特征,得到每种行为的特征矩阵。对特征矩阵进行CLDS时序建模,输出能唯一表示该类手语视频的描述符M=(A,C),然后利用子空间角度计算各模型之间的相似度;通过改进的K最近邻(K-nearest neighbors, KNN)算法得到最终分类结果。在中国手语数据集(Chinese sign language, CSL)上的实验表明,本文方法与现有的手语识别方法相比,具有更高的识别率。  相似文献   

8.
针对静态手势识别算法存在特征计算复杂度高,实时性差的问题,提出了一种新的BOF-Gist特征对手势图像进行表示。该特征的优势是在保持Gist特征原有优势的基础上,有效地表征手势图像的局部特征和全局特征,并且特征维数明显降低,实时性好。在标准数据库上的测试表明,该算法对于简单、复杂背景下十种手语手势分别得到了90.42%与79.05%的正确识别率,同时验证了算法的实时性。  相似文献   

9.
基于传感网络的手语识别随着手势复杂程度的提升,识别的难度增大,因此,为了获取更加精准的静态手语识别结果,提出了基于无线传感技术与卷积神经网络的静态手语识别方法。通过无线传感技术对静态手语图像滤波处理,采用特征提取方法提取静态手语特征并进行融合处理,将融合后的连续二维特征图像直接转换为一维向量,将其作为卷积神经网络的输入,通过迭代训练完成静态手语识别。实验结果表明,所提方法在不同场景下静态手语识别精度高于94.11%,且识别速度较快,由此验证了所提方法可以快速准确完成静态手语识别。  相似文献   

10.
基于形状特征的字母手势的分类及识别算法   总被引:2,自引:0,他引:2  
郭兴伟  葛元  王林泉 《计算机工程》2004,30(18):130-132,186
提出了一种基于形状特征的字母手势的分类及识别算法。根据手势图像中手指的方向及数目进行粗分类,然后在边界图像及二值图像中提取手势的形状特征向量,进行基于类似度的模板匹配,实现对字母手势的细分类。实验证明,基于形状特征的粗分类能够排除完全不匹配的手势,减少了识别过程中的匹配搜索时间,提高了识别率。  相似文献   

11.
谈家谱  徐文胜 《计算机应用》2015,35(6):1795-1800
针对基于视频的弯曲指尖点识别难、识别率不高的问题,提出一种基于深度信息、骨骼信息和彩色信息的手势识别方法。该方法首先利用Kinect相机的深度信息和骨骼信息初步快速判定手势在彩色图像中所在的区域,在该区域运用YCrCb肤色模型分割出手势区域;然后计算手势轮廓点到掌心点的距离并生成距离曲线,设定曲线波峰与波谷的比值参数来判定指尖点;最后结合弯曲指尖点特征和最大内轮廓面积特征识别出常用的12个手势。实验结果验证阶段邀请了6位实验者在相对稳定的光照环境条件下来验证提出的方法,每个手势被实验120次,12种手势的平均识别率达到了97.92%。实验结果表明,该方法能快速定位手势并准确地识别出常用的12种手势,且识别率较高。  相似文献   

12.
为实现感兴趣区手语视频编码,提高通话效率,提出一种基于细胞神经网络(CNN)的快速手语视频分割方法。该方法首先利用肤色信息特征进行基于CNN的肤色检测,检测出手语视频中的肤色区域;然后对肤色检测结果,利用帧差法进行基于CNN的运动检测,获得初始的手势区域;最后采用形态学处理方法进行空洞填充和边界平滑,实现了手语视频图像序列中的面部和手部区域的分割。研究结果表明,该方法能够快速准确地进行手语视频分割。  相似文献   

13.
多层DGMM识别器在中国手语识别中的应用   总被引:4,自引:0,他引:4  
吴江琴  高文  陈熙霖  马继涌 《软件学报》2000,11(11):1430-1439
手语是聋人使用的语言,是由手形动作辅之以表情姿势由符号构成的比较稳定的表达系统 ,是一种靠动作/视觉交际的语言.手语识别的研究目标是让机器“看懂”聋人的语言.手 语识别和手语合成相结合,构成一个“人-机手语翻译系统”,便于聋人与周围环境的交 流.手语识别问题是动态手势信号即手语信号的识别问题.考虑到系统的实时性及识别效率, 该系统选取Cyberglove型号数据手套作为手语输入设备,采用DGMM(dynamic Gaussian mixt ure model)作为系统的识别技术,并根据中国手语的具体特点,在识别模块中选取了多层识 别器,可识别中国手语字典中的274个词条,识别率为97.4%.与基于单个DGMM的识别系统比 较,这种模型的识别精度与单个DGMM模型的识别精度基本相同,但其识别速度比单个DGMM的 识别速度有明显的提高.  相似文献   

14.
尚常军  丁瑞 《计算机应用》2016,36(10):2885-2889
针对复杂环境下的深度图像手势特征提取信息冗余量大、编码不稳定等问题,提出了一种改进的基于曲率局部二值模式(LBP)的深度图像手势特征提取算法。该算法首先通过坐标转换将分割出的手势深度数据转换为点云数据;其次利用移动最小二乘法对手势点云数据进行曲面拟合;然后计算出能够更加准确描述物体三维表面几何信息特征的高斯曲率;最后利用改进的LBP均匀模式对高斯曲率数据进行编码形成特征向量。在美国手语(ASL)手势数据库上该算法的平均识别率达到了92.1%,与3D局部二值模式(3DLBP)和梯度LBP相比分别提高了18.5个百分点和13.7个百分点。实验结果表明,该算法可以区分外部轮廓相似但内部结构不同的手势,有效提高了在描述手势深度图像内部细节方面的准确性。  相似文献   

15.
基于特征包支持向量机的手势识别   总被引:3,自引:0,他引:3  
针对类肤色信息或复杂背景的影响,难以通过手势分割得到精确手势轮廓而对后期手势识别率与实时交互的影响,提出了一种基于特征包支持向量机(BOF-SVM)的手势识别方法。采用SIFT算法提取手势图像局部不变性特征点,将手势局部特征向量(尺度不变特征变换(SIFT)描述子)进行K-means聚类生成视觉码书,并通过视觉码书量化每一幅手势图像的视觉码字集合,以此获得手势图像的固定维数的表征向量来训练支持向量机(SVM)多类分类器。该方法只需框定手势所在区域,无需精确地分割人手。实验表明,该方法对9种交互手势的平均识别率达到92.1%,并具有很好的鲁棒性及实时性,能适应环境的变化。  相似文献   

16.
Communication between people with disabilities and people who do not understand sign language is a growing social need and can be a tedious task. One of the main functions of sign language is to communicate with each other through hand gestures. Recognition of hand gestures has become an important challenge for the recognition of sign language. There are many existing models that can produce a good accuracy, but if the model test with rotated or translated images, they may face some difficulties to make good performance accuracy. To resolve these challenges of hand gesture recognition, we proposed a Rotation, Translation and Scale-invariant sign word recognition system using a convolutional neural network (CNN). We have followed three steps in our work: rotated, translated and scaled (RTS) version dataset generation, gesture segmentation, and sign word classification. Firstly, we have enlarged a benchmark dataset of 20 sign words by making different amounts of Rotation, Translation and Scale of the original images to create the RTS version dataset. Then we have applied the gesture segmentation technique. The segmentation consists of three levels, i) Otsu Thresholding with YCbCr, ii) Morphological analysis: dilation through opening morphology and iii) Watershed algorithm. Finally, our designed CNN model has been trained to classify the hand gesture as well as the sign word. Our model has been evaluated using the twenty sign word dataset, five sign word dataset and the RTS version of these datasets. We achieved 99.30% accuracy from the twenty sign word dataset evaluation, 99.10% accuracy from the RTS version of the twenty sign word evolution, 100% accuracy from the five sign word dataset evaluation, and 98.00% accuracy from the RTS version five sign word dataset evolution. Furthermore, the influence of our model exists in competitive results with state-of-the-art methods in sign word recognition.  相似文献   

17.
谢艺蓉  马永杰 《计算机工程》2022,48(10):262-269
卷积神经网络具有较优的图像特征提取性能,被广泛应用于交通标志识别领域。然而,现有交通标志识别算法通常基于专家经验设计改进的图像特征提取网络,需经历图像预处理和模型调参过程,导致模型的复杂度增大。提出一种基于进化ResNet的交通标志识别算法。将ResNet的构建参数嵌入到进化算法中,在架构搜索空间中以构建块作为基本单位,并将网络深度、卷积层通道数、池化层类型和模块构建顺序作为搜索空间的可变参数,利用交叉、变异等遗传算子执行自适应优化搜索,以确保进化搜索的有效性,同时设计适用于交通标志识别的轻量化网络。在德国交通标志数据集上的实验结果表明,该算法的识别精度达到99.41%,而参数量仅为2.37×106,相比Multi-column DNN、MFC、MFC+ELM等算法,在保证识别精度的同时减少网络参数量。  相似文献   

18.
In this paper, we propose a new method for recognizing hand gestures in a continuous video stream using a dynamic Bayesian network or DBN model. The proposed method of DBN-based inference is preceded by steps of skin extraction and modelling, and motion tracking. Then we develop a gesture model for one- or two-hand gestures. They are used to define a cyclic gesture network for modeling continuous gesture stream. We have also developed a DP-based real-time decoding algorithm for continuous gesture recognition. In our experiments with 10 isolated gestures, we obtained a recognition rate upwards of 99.59% with cross validation. In the case of recognizing continuous stream of gestures, it recorded 84% with the precision of 80.77% for the spotted gestures. The proposed DBN-based hand gesture model and the design of a gesture network model are believed to have a strong potential for successful applications to other related problems such as sign language recognition although it is a bit more complicated requiring analysis of hand shapes.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号