首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
超分辨率图像复原的目的是从几幅包含有相同观测区域的图像序列中重建更高分辨率的图像。一般的超分辨率算法没有考虑文本图像的分段连续性,因此有可能丢失笔画边缘处的细节信息。双边总变分正则算法具有很好的边缘保持能力,因此可以应用到文本图像的超分辨率恢复。本文根据汉字的字符结构特点,对双边总变分正则算法进行了改进,根据汉字的笔画组成特征。提出新的正则项。该方法由于充分地考虑了汉字文本图像的结构特征,因此能够很好地保持汉字的笔画的尖锐边缘。实验也证明了使用本文所提出的BTVCH算法获得的超分辨率文本图像可以获得最高的字符识别率。  相似文献   

2.
为解决在自然场景下光照不均匀使得图像对比度低,导致图像文字定位错检的问题,采用自适应子直方图均衡算法(Adaptive Sub-Histogram Equalization, ASHE)对图像进行对比度增强处理;采用最大稳定极值区域算法提取候选区域,结合形态学与启发式规则进行初步定位;通过改进的笔画宽度变换算法(SWT)与汉字特征进行精确定位;使用字符链融合算法,将文字区域合并,实现最终文本定位。实验结果表明改进算法对自然场景低对比度图像中文字具有较高的定位准确率,并且有效地降低了时间复杂度。  相似文献   

3.
现有的手写汉字脱机笔迹鉴别方法存在只能针对特定字符或需要大量样本字符等问题,为此提出一种基于笔画曲率特征的笔迹鉴别方法。首先运用数学形态学对采集的笔迹图像进行预处理,在横、竖、撇、捺四个方向提取具有代表性的笔画骨架,然后对笔画骨架进行圆的重构,提取四个方向笔画圆的曲率作为特征值组成笔迹特征矩,根据待鉴别的笔迹特征矩与数据库中笔迹特征矩向量夹角相似性度量结果对样本做出判断。实验结果表明该文方法对于待鉴别样本字符的内容没有要求,样本字符数量要求低、应用范围广、鲁棒性强。  相似文献   

4.
为了提高经典目标检测算法对自然场景文本定位的准确性,以及克服传统字符检测模型由于笔画间存在非连通性引起的汉字错误分割问题,提出了一种直接高效的自然场景汉字逼近定位方法。采用经典的EAST算法对场景图像中的文字进行检测。对初检的文字框进行调整使其更紧凑和更完整地包含文字,主要由提取各连通笔画成分、汉字分割和文字形状逼近三部分组成。矫正文字区域和识别文字内容。实验结果表明,提出的算法在保持平均帧率为3.1 帧/s的同时,对ICDAR2015、ICDAR2017-MLT和MSRA-TD500三个多方向数据集上文本定位任务中的F-score分别达到83.5%、72.8%和81.1%;消融实验验证了算法中各模块的有效性。在ICDAR2015数据集上的检测和识别综合评估任务中的性能也验证了该方法相比一些最新方法取得了更好的性能。  相似文献   

5.
针对图像处理(如OCR技术)对图像方向要求十分严格,文本图像方向具有不确定性的问题,提出了中文文本图像倒置快速检测算法.利用投影技术定位出文本字符,结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点判断出类型,结合标点符号的使用习惯,采用统计的方法判断中文文本图像是否倒置.实验结果表明,投影方法可以不用基于内容达到高效快速的要求,利用统计方法可以保证判别率,该方法可用于OCR预处理过程.  相似文献   

6.
完全基于结构知识的汉字笔画抽取方法   总被引:17,自引:1,他引:16  
从汉字结构知识出发,提出了一种从汉字图像直接抽取笔画的算法,给出了抽取横、竖、撇、捺4种笔画的完全量化的昨去除不同字体的笔画修饰噪声的规则,该方法较好地解决了各笔画的相交、相连及噪声排队等总理2,综在汉字识别及字体自动生成等汉字信息处理方面有重要作用。  相似文献   

7.
基于双弹性网格的手写体汉字识别   总被引:5,自引:0,他引:5  
特征提取是手写体汉字识别的关键,目前四方向网格特征已被实验证实是一种较好的手写体汉字特征。针对通常的纵横弹性网格对汉字“撇、捺”笔画特征提取的不足,提出一种新的网格构造技术——对角弹性网格,它由45°和135°的对角直线构成,将汉字图像划分为多个菱形,能够很好地适应汉字在“撇、捺”方向的变化。将这两种网格单独,以及相互组合成双网格等情况分别进行手写体识别实验,实验结果验证了对角弹性网格的有效性和双弹性网格的高识别率性。  相似文献   

8.
由汉字的轮廓提取笔画,其关键之处在于找到笔画相交处的交点。在提取汉字图像轮廓和特征点的基础上,提出了笔画分离算法,并通过程序实现了该算法。实验证明该算法对于提取印刷体汉字和无连笔的手写体汉字是有效的。  相似文献   

9.
书写顺序恢复是从静态文本图像中提取动态的字符书写顺序信息,将2维的图像转换为1维的书写位置的时间序列的过程.为了对手写汉字进行书写顺序提取,提出了一种脱机手写汉字书写顺序的恢复模型.该模型首先将汉字分为整字、部件、子部件和笔画4个层次;然后利用4种拆分操作将整字拆分为部件,再将部件拆分为子部件;最后通过定义一组拆分关系与子部件偏序关系之间的对应规则来得到子部件的全序关系.而将子部件作为最基本的恢复单位,其书写顺序可通过对笔画和交叉笔画对进行分类来得到.实验表明,该模型提出的汉字书写顺序恢复方法的恢复结果具有较高的准确率,且处理速度达到了6.9字/s.  相似文献   

10.
侯艳平  王正群  邹军  沈杰 《计算机应用》2007,27(6):1500-1501
针对手写体汉字识别过程中的特征抽取,提出了一种改进的抽取笔画平面的方法。首先,将手写汉字图像进行非线性规一化;然后,利用弹性笔画长度,根据汉字的横竖撇捺四种笔画分别抽取出四种笔画的平面;最后,将四个笔画平面分别均匀划分成S×S个小网格,在每个小格内计算其笔画交叉数目,便得到了一个4S2维的特征向量。实验利用基于最小距离的分类器对含有7600(19类)个汉字的测试集进行了分类,取得了较好的识别效果。  相似文献   

11.
针对古代汉字文档的特点,提出了适合于古文档的列切分方法和字切分方法。提出的列切分方法直接对文档的笔画投影进行分析,采用一种基于分层投影过滤和变长间隙阈值的递归切分算法。该算法在列间隔较小、列与格线存在粘连、文档具有一定程度的倾斜的情况下,也能准确地抽取出列,尤其对短列的切分达到了较好的效果。提出的字切分方法分为两步,进行粗切分确定大致的切分位置,采用基于连通域分析与粘连点判断的方法做进一步的细切分。该算法对具有较多粘连和重叠汉字的列,也能较好地切分出完整的单字。实验结果表明,提出的方法用于古代汉字文档切分能够获得较好的效果。  相似文献   

12.
短文本情感分析用于判断文本的情感极性,在商品评论、舆情监控等领域有重要应用。由于目前主流的基于词注意力机制的双向循环神经网络模型性能很大程度上依赖于分词的准确性,且注意力机制需较多的参数依赖,无法使模型更多的关注短文本的内部序列关系。针对上述问题,该文提出了基于字向量表示方法并结合Self-attention和BiLSTM的中文短文本情感分析算法。首先,对短文本进行字向量化表示,采用BiLSTM网络提取文本上下文关系特征,通过自注意力机制动态调整特征权重,Softmax分类器得到情感类别。在COAE 2014微博数据集和酒店评论数据集的实验结果表明,采用字向量文本表示方法较词向量更适合短文本,自注意力机制可以减少外部参数依赖,使模型能学到更多的文本自身关键特征,分类性能可分别提高1.15%和1.41%。  相似文献   

13.
针对复杂背景下汉字匹配准确率较低的问题,提出一种改进的SURF算法。该算法利用灰度分级的字符分割方法,先进行灰度分割增强图像的对比度,采用灰度分级树将图像中的所有像素处理为树的模式进行计算,根据灰度分级确定主节点,根据主节点的级别所对应的灰度值对图像进行分割。同时,根据汉字结构的特殊性,取消了SURF算法的旋转不变性。实验结果表明,与未使用改进的SURF算法相比,对图像质量较差的文本图像,改进的SURF算法能有效地提高其匹配的准确率。  相似文献   

14.
梁正友  欧杰  俞闽敏 《计算机工程》2011,37(23):276-278
在现有的网页抽取技术中,正文定位方法仅考虑网页文本信息,当正文图片信息较多、文本信息偏少时,容易出现偏差,且定位准确率较低。针对该问题,从信息论角度出发,结合网页中的文本信息图片信息,设计一种对网页中图片信息量和有效信息量的估算方法,在此基础上,提出一种基于图文信息量的网页正文定位算法。实验结果表明,该算法在不同正文文本量的情况下,均具有较高的定位准 确率。  相似文献   

15.
图像表示及在检索系统中的应用   总被引:1,自引:0,他引:1  
康寅  杨文川 《软件》2011,32(1):38-41
目前,网上流行的过滤和搜索系统主要是依靠文本内容,很少有图像搜索系统。广义的图像搜索引擎可以输入图像,从网络中搜索类似的图像及文本内容,免去了语言的障碍。常用的技术为基于内容的图像检索(CBIR),它是图像分析的一个的重要研究领域,也是目前搜索引擎技术的难点。造成图像分析与检索困难的原因是目前还没有标准的描述图像的方法,众所周知,图像相对于文本理解起来更为复杂,表达的信息也更为丰富。本文阐述了一种基于标题、颜色、形状等多种特征的图像信息表示方法,并利用文本分析、颜色直方图的颜色特征提取、图像边缘检测实现了对图片信息的展示与检索功能。  相似文献   

16.
复杂背景下的票据字符分割方法   总被引:2,自引:0,他引:2  
叶龙欢  王俊峰  高琳  袁军 《计算机应用》2012,32(11):3198-3205
针对票据字符识别中图像存在的底纹、印章和图案等复杂背景干扰问题,提出一种有效的字符分割方法。通过快速提升小波变换提取出图像中具有显著性的字符纹理特征。采用一种由粗到精的搜索策略,在图像区域和像素两个层次上逐步区分出文字和背景。首先根据区域纹理特征,利用支持向量机对区域进行分类,定位出包含文字的图像区域;然后采用K-means算法对文字区域内的像素进行聚类划分,从而实现文字分割。实验结果表明,方法具有较高的准确性,并且在背景纹理和印章干扰的情况下具有较好的鲁棒性。  相似文献   

17.
互联网中中文地址文本蕴含着丰富的空间位置信息,为了更加有效地获取文本中的地址位置信息,提出一种基于地址语义理解的地址位置信息识别方法。通过对训练语料进行词频统计,制定地址要素特征字集合和字转移概率,构造特征字转移概率矩阵,并结合字符串最大联合概率算法,设计了一种不依赖地名词典和词性标注的地址识别方法。实验结果表明,该方法对地址要素特征字突出且存在歧义的中文地址的完全匹配率为76.85%,识别准确率为93.11%。最后,与机械匹配算法和基于经验构造转移概率矩阵的方法进行对比实验,实验结果表明了该方法的可用性和有效性。  相似文献   

18.
针对文本图像倾斜检测的问题, 提出了一种新的基于几何约束的文本图像倾斜角自动检测算法。该算法采用边界标记自动机的方法对一组同行字符轮廓进行检测从而得到该组字符轮廓的最低点信息, 再用矩的方法剔除噪声字符, 并确定页面的倾斜角度。实验结果表明, 该算法在检测效率与准确率上都有了明显的提高, 同时在处理较大倾斜角和较少字符数目的倾斜检测中也有较好的执行效率。因此, 该算法可广泛应用于包括英文、中文、日文在内的多种语言文本图像的倾斜检测中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号