首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 164 毫秒
1.
图书书脊和索书号的识别是图书馆自动存取书机器人的关键技术,提高书脊和索书号识别的效率是研究的热点.研究一种简单的投影算子将其应用于书脊和索书号的识别以提高了识别效率和速度;以书架图书二值化图内容为基础,构建图书列向量,在列投影算子的作用下求得列投影向量,根据列投影向量曲线的情况快速准确识别图书书脊;以单本书脊二值化图内容为基础,分别构建书脊行向量和列向量,通过行投影算子得到行投影向量,根据行投影向量曲线的变化情况识别索书号元素的行位置信息,通过列投影算子得到列投影向量,根据列投影向量曲线的变化情况识别出索书号元素的列位置信息,根据行、列位置信息切分出索书号元素图片,在归一化后计算待识别索书号元素图片与字符标准模板的匹配度,将最大匹配度所对应的字符标准模板映射的字符作为识别结果;经实验证明基于投影算子的书脊和索书号识别的速度快,准确率高.  相似文献   

2.
针对印刷体维吾尔文文字识别系统中的字符识别正确率较低这一难点问题,采用对字符图像进行横向扫描和纵向扫描生成行和列投影图, 结合三级分类,将目标字符与对应分类中的字符的双投影图逐一归一化并进行相关性均值计算的方法,取均值最大的字符作为最佳匹配识别结果,实现了对维文字符的识别。实验证明这种基于字符归一化双投影互相关性匹配识别算法方法抗干扰性强,简单易行,匹配精度高,使得印刷体维吾尔文字字符识别的正确率有了进一步提高。  相似文献   

3.
提出一种新的维吾尔语文字识别研究方法。首先,建立字符样本库,并对库中文字图像归一化。然后,将测试图像与样本图像进行垂直和水平双方向投影相关性检测,对与测试图像双投影相关性较高的样本字符进行笔画数特征提取,得到预分类结果。最后,将测试图像与预分类结果进行SIFT关键点检测、方向描述子生成与配准,与测试图片匹配点对最多的预分类结果为识别结果,并输出该结果标记符号对应的维吾尔语字符。实验结果表明:该方法能减少字符样本的数量,并有效解决测试图像尺度与几何形变的差异造成的匹配困难问题。  相似文献   

4.
基于归一化向量的文本分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。  相似文献   

5.
刘卫  李和成 《计算机应用》2012,32(8):2309-2312
针对传统隐马尔可夫模型(HMM)在对手写维吾尔文字符建模时,字符宽度变化大,模型训练收敛缓慢,且易陷入局部极值的问题,提出一种基于保局投影(LPP)与HMM相结合的维吾尔字符识别方法。首先,通过高度归一化保持原图像的宽高比,用滑动窗获取子图像序列,形成观测向量序列;其次,采用局部保持投影将观测序列映射到低维空间,并用随机抽样方法降低邻接图矩阵的规模;最后,采用新观测序列训练HMM。该算法在降维的同时提高了HMM的收敛速度,降低了陷入局部极值的风险。实验结果显示,算法的平均收敛步数减少,错误率降低,表明算法是有效的。  相似文献   

6.
采用多智能体遗传算法(MGA)进行投影寻踪聚类(PPC)建模,对投影向量约束条件采用两种不改变迭代进化过程的归一化处理方法,经三种不同类型的数据分别进行建模,得到了相同的建模结果,有效地解决了求解最佳投影向量的最优化问题。对评价指标数据采用极大化或极小化(不同的归一化)处理方式,得到的投影向量系数互为相反数,同一样本的投影值之间只相差一个常数,说明PPC建模技术既可用于探索性研究,也可用于验证性分析。PPC技术主要用于大样本情况,稳健性和可靠性均较好;指标之间存在明显的相关性,会影响建模结果的有效性和合理性。  相似文献   

7.
基于归一化投影直方图不变矩的图像特征提取   总被引:2,自引:0,他引:2       下载免费PDF全文
张伟 《计算机工程》2011,37(1):226-228
提出归一化投影直方图和在平移缩放变换下保持不变的归一化投影直方图不变矩概念,由此构造归一化投影直方图不变矩,用于提取图像特征。实验结果证明,与经典不变矩理论相比,该方法能有效反映图像的结构特征,识别细微差异和区分相似图形的能力更强,应用于图像识别时具有较好的鲁棒性。  相似文献   

8.
面向无人驾驶需要实时获得高速公路道路视觉信息的要求,提出一种高速公路指路标志字符检测方法。通过颜色和几何形状特征,得到高速公路指路标志牌,并以标志牌为对象检测字符。检测字符的步骤为:通过二值化方法得到二值图,经过矫正方法将倾斜的标志牌进行倾斜矫正,并对二值图进行过滤;通过多级投影策略对二值图进行切割,得到字符块,再根据版面排列对相关联的字符块进行合并得到字符区域;提取字符区域的HOG特征,通过支持向量机去除伪目标字符区域。实验结果表明在自然场景下高速公路指路标志字符检测的查全率达到97%以上,准确率达到96%以上。  相似文献   

9.
一类特殊印刷体字符的分割和识别方法   总被引:1,自引:0,他引:1  
针对一类工业场景下印刷体字符的特点.本文提出了一种基于方波参数求取进行字符分割的方法。首先.给定待分割字符串区域的二值化图像,预估字符串起始位置、字符宽度和字符间距,并作为基表参数生成单位方波函数.将方波函数以象素为单位离散化后看成一行向量、图像垂直扫描投影成一列向量,然后进行内积运算.在给定参数区间范围内搜索使得内积最大的一组作为精确分割参数;然后采用一种基于相似度匹配的字符识别方法完成字符识别。实验结果表明.该方法取得了满意的分割识别效果。  相似文献   

10.
为了获得具有较高识别率的算法,提出了一种基于水平积分投影函数和HMM的人脸识别方法.投影函数是进行人脸检测时常用的方法,它可以在很大程度上反映出人脸的特征.将归一化后的图像看成一个二维矩阵,将一维的水平积分投影向量转换成一维向量序列,通过HMM对这些一维向量序列进行训练,从而得到一个优化的HMM.实验结果表明,这种方法的计算量小,运行速度较快,识别率较高.  相似文献   

11.
具有统计不相关性的图像投影鉴别分析及人脸识别   总被引:25,自引:1,他引:25  
提出了一种新的图像投影鉴别分析方法。与Liu鉴别投影分析方法相比,该方法具有能够消除投影特征向量之间相关性的优点,另外,所提出的方法是直接基于图像矩阵的,与以往的基于图像向量的鉴别方法相比,它的突出优点是大大地提高了特征抽取的速度。最后,在ORL标准人脸库和MUST603人脸库上的试验结果表明,所提出的图像投影鉴别分析方法较Liu的方法在识别性能上有了较大幅度的提高,在ORL标准人脸库和NUST603人脸库上的试验结果表明,所提出的图像投影鉴别分析方法较Liu的方法在识别性能上有了较大幅度的提高,在普通的分类器下分别达到95.5%和99.4%的识别率,该识别率明显优于颇有影响的Fisherfaces方法,而且,特征抽取的速度提高了近15倍。  相似文献   

12.
提出了一种新的图像投影鉴别分析方法。首先,与Liu投影鉴别分析方法相比,具有能够消除投影特征分量之间相关性的优点。其次,该方法从整体上考虑投影集的可分性。即样本在图像最佳鉴别矢量上的投影集从整体上具有最佳的可分性。另外,所提出的方法是直接基于图像矩阵的,与以往的基于图像向量的鉴别方法相比,它的突出优点是大大地提高了特征抽取的速度。最后,在0RL标准人脸库上的试验结果表明,所提出的图像投影鉴剐分析方法较Liu的方法在识别性能上有了较大幅度的提高,在普通的分类器下达到95%识别率。该识别率明显优于颇有影响的Fisher-faces方法,其特征抽取的速度提高了近19。68倍。  相似文献   

13.
现有的基于投影的行人重识别方法具有训练时间长、投影矩阵维数高、识别率低等问题.此外在建立训练集时,还会出现类内样本数目远少于类间样本数目的情况.针对这些问题,提出了基于距离中心化的相似性度量算法.在构建训练集时,将同一组目标群体特征值中心化,利用中心特征值来构建类间距离,而类内距离保持不变.这样使得类内类间样本数目接近,可以很好地缓解类别不平衡所带来的过拟合风险.另外在学习投影矩阵时,利用训练集更新策略,学习若干组投影向量,使得到的投影向量近似正交,这样既可以有效减少运算复杂度和存储复杂度,又可以使得学习到的投影向量能够通过简单的相乘近似得到原来的投影矩阵.最后,在学习投影向量时采用共轭梯度法,该方法具有二次收敛性,能够快速收敛到目标精度.实验结果表明:提出的算法具有较高的效率,在不同数据集上的识别率都有明显的提升,训练时间也比其他常用的行人重识别算法要短.  相似文献   

14.
杨静  于旭  谢志强 《计算机学报》2012,35(5):1002-1010
针对基于向量投影的支持向量预选取方法选取投影直线过于简单粗糙,导致需要选取较多的边界向量才能包含原始问题的支持向量的问题,提出了一种新的支持向量预选取方法.该方法通过定义好的投影直线具备的3个必要特征,提出:对于线性可分情况,利用Fisher线性判别算法来获取最佳的投影直线;对于非线性可分情况,利用特征空间中心向量所在直线作为相应的投影直线.由于该方法确定的投影直线可以更好地对样本投影进行分离,因此,与基于向量投影的支持向量预选取方法相比,该方法可用更少的原始样本来构造边界向量集合,可有效降低支持向量机算法的时空复杂度.在两个人工数据集和一个现实数据集上的实验表明,所提方法不仅可以达到以往各种实用的支持向量机算法分类精度,而且更为高效.  相似文献   

15.
人脸识别中多目标最优不相关图像鉴别分析研究   总被引:1,自引:0,他引:1       下载免费PDF全文
考虑图像投影鉴别分析问题,为提高特征抽取的速度和识别率,利用图像矩阵直接构造图像散布矩阵,在具有统计不相关的条件下将Foley-Sammon鉴别分析(FSLDA)转化为两目标约束优化问题,并给出了有效投影向量的概念;根据多目标优化的最优性条件可将求取有效投影向量的问题归结为求广义特征方程的最大特征值对应的特征向量,并据此进行特征抽取,进而提出了两目标最优图像投影鉴别分析方法。与其他鉴别投影分析方法相比,该方法具有以下特点:(1)可直接由图像矩阵构建散布矩阵;(2)有效投影向量具有统计不相关性;(3)训练样本的类内散布矩阵不必为可逆的,也不需要求某种形式矩阵的逆。在ORL标准人脸库和NUST603人脸库上的试验结果表明,上述图像投影鉴别分析方法在识别性能上较以往的方法有一定的提高,尤其是特征抽取的速度有明显的提高。  相似文献   

16.
以说话人识别中的背景模型为基础,根据模型中的各个高斯分量,构造出说话人特征空间,将长度不一样的语句映射成为空间中大小相同的向量,且经过相关矩阵进行规整后,采用线性支持向量机进行说话人识别。借鉴几种常见的特征规整方式,结合语句映射后的向量,提出四种不同的规整方法:均值/方差规整、权重规整、WLOG规整和球形规整,并与概率序列核进行比较研究。根据语音特征向量序列中相邻的特征向量的前后转移关系,结合提出的概率序列核,构造出转移概率序列核。实验在NIST2001库上进行,结果表明概率序列核模型识别性能接近经典的UBM-MAP模型,将这两类模型得分进行融合,可非常明显地提高识别性能,进一步融合转移概率序列核后,性能还可提高19.1%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号