共查询到18条相似文献,搜索用时 265 毫秒
1.
超分辨率图像复原的目的是从几幅包含有相同观测区域的图像序列中重建更高分辨率的图像。一般的超分辨率算法没有考虑文本图像的分段连续性,因此有可能丢失笔画边缘处的细节信息。双边总变分正则算法具有很好的边缘保持能力,因此可以应用到文本图像的超分辨率恢复。本文根据汉字的字符结构特点,对双边总变分正则算法进行了改进,根据汉字的笔画组成特征。提出新的正则项。该方法由于充分地考虑了汉字文本图像的结构特征,因此能够很好地保持汉字的笔画的尖锐边缘。实验也证明了使用本文所提出的BTVCH算法获得的超分辨率文本图像可以获得最高的字符识别率。 相似文献
2.
为解决在自然场景下光照不均匀使得图像对比度低,导致图像文字定位错检的问题,采用自适应子直方图均衡算法(Adaptive Sub-Histogram Equalization, ASHE)对图像进行对比度增强处理;采用最大稳定极值区域算法提取候选区域,结合形态学与启发式规则进行初步定位;通过改进的笔画宽度变换算法(SWT)与汉字特征进行精确定位;使用字符链融合算法,将文字区域合并,实现最终文本定位。实验结果表明改进算法对自然场景低对比度图像中文字具有较高的定位准确率,并且有效地降低了时间复杂度。 相似文献
3.
4.
为了提高经典目标检测算法对自然场景文本定位的准确性,以及克服传统字符检测模型由于笔画间存在非连通性引起的汉字错误分割问题,提出了一种直接高效的自然场景汉字逼近定位方法。采用经典的EAST算法对场景图像中的文字进行检测。对初检的文字框进行调整使其更紧凑和更完整地包含文字,主要由提取各连通笔画成分、汉字分割和文字形状逼近三部分组成。矫正文字区域和识别文字内容。实验结果表明,提出的算法在保持平均帧率为3.1 帧/s的同时,对ICDAR2015、ICDAR2017-MLT和MSRA-TD500三个多方向数据集上文本定位任务中的F-score分别达到83.5%、72.8%和81.1%;消融实验验证了算法中各模块的有效性。在ICDAR2015数据集上的检测和识别综合评估任务中的性能也验证了该方法相比一些最新方法取得了更好的性能。 相似文献
5.
针对图像处理(如OCR技术)对图像方向要求十分严格,文本图像方向具有不确定性的问题,提出了中文文本图像倒置快速检测算法.利用投影技术定位出文本字符,结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点判断出类型,结合标点符号的使用习惯,采用统计的方法判断中文文本图像是否倒置.实验结果表明,投影方法可以不用基于内容达到高效快速的要求,利用统计方法可以保证判别率,该方法可用于OCR预处理过程. 相似文献
6.
完全基于结构知识的汉字笔画抽取方法 总被引:17,自引:1,他引:16
从汉字结构知识出发,提出了一种从汉字图像直接抽取笔画的算法,给出了抽取横、竖、撇、捺4种笔画的完全量化的昨去除不同字体的笔画修饰噪声的规则,该方法较好地解决了各笔画的相交、相连及噪声排队等总理2,综在汉字识别及字体自动生成等汉字信息处理方面有重要作用。 相似文献
7.
8.
9.
书写顺序恢复是从静态文本图像中提取动态的字符书写顺序信息,将2维的图像转换为1维的书写位置的时间序列的过程.为了对手写汉字进行书写顺序提取,提出了一种脱机手写汉字书写顺序的恢复模型.该模型首先将汉字分为整字、部件、子部件和笔画4个层次;然后利用4种拆分操作将整字拆分为部件,再将部件拆分为子部件;最后通过定义一组拆分关系与子部件偏序关系之间的对应规则来得到子部件的全序关系.而将子部件作为最基本的恢复单位,其书写顺序可通过对笔画和交叉笔画对进行分类来得到.实验表明,该模型提出的汉字书写顺序恢复方法的恢复结果具有较高的准确率,且处理速度达到了6.9字/s. 相似文献
10.
11.
针对古代汉字文档的特点,提出了适合于古文档的列切分方法和字切分方法。提出的列切分方法直接对文档的笔画投影进行分析,采用一种基于分层投影过滤和变长间隙阈值的递归切分算法。该算法在列间隔较小、列与格线存在粘连、文档具有一定程度的倾斜的情况下,也能准确地抽取出列,尤其对短列的切分达到了较好的效果。提出的字切分方法分为两步,进行粗切分确定大致的切分位置,采用基于连通域分析与粘连点判断的方法做进一步的细切分。该算法对具有较多粘连和重叠汉字的列,也能较好地切分出完整的单字。实验结果表明,提出的方法用于古代汉字文档切分能够获得较好的效果。 相似文献
12.
短文本情感分析用于判断文本的情感极性,在商品评论、舆情监控等领域有重要应用。由于目前主流的基于词注意力机制的双向循环神经网络模型性能很大程度上依赖于分词的准确性,且注意力机制需较多的参数依赖,无法使模型更多的关注短文本的内部序列关系。针对上述问题,该文提出了基于字向量表示方法并结合Self-attention和BiLSTM的中文短文本情感分析算法。首先,对短文本进行字向量化表示,采用BiLSTM网络提取文本上下文关系特征,通过自注意力机制动态调整特征权重,Softmax分类器得到情感类别。在COAE 2014微博数据集和酒店评论数据集的实验结果表明,采用字向量文本表示方法较词向量更适合短文本,自注意力机制可以减少外部参数依赖,使模型能学到更多的文本自身关键特征,分类性能可分别提高1.15%和1.41%。 相似文献
13.
针对复杂背景下汉字匹配准确率较低的问题,提出一种改进的SURF算法。该算法利用灰度分级的字符分割方法,先进行灰度分割增强图像的对比度,采用灰度分级树将图像中的所有像素处理为树的模式进行计算,根据灰度分级确定主节点,根据主节点的级别所对应的灰度值对图像进行分割。同时,根据汉字结构的特殊性,取消了SURF算法的旋转不变性。实验结果表明,与未使用改进的SURF算法相比,对图像质量较差的文本图像,改进的SURF算法能有效地提高其匹配的准确率。 相似文献
14.
15.
图像表示及在检索系统中的应用 总被引:1,自引:0,他引:1
目前,网上流行的过滤和搜索系统主要是依靠文本内容,很少有图像搜索系统。广义的图像搜索引擎可以输入图像,从网络中搜索类似的图像及文本内容,免去了语言的障碍。常用的技术为基于内容的图像检索(CBIR),它是图像分析的一个的重要研究领域,也是目前搜索引擎技术的难点。造成图像分析与检索困难的原因是目前还没有标准的描述图像的方法,众所周知,图像相对于文本理解起来更为复杂,表达的信息也更为丰富。本文阐述了一种基于标题、颜色、形状等多种特征的图像信息表示方法,并利用文本分析、颜色直方图的颜色特征提取、图像边缘检测实现了对图片信息的展示与检索功能。 相似文献
16.
复杂背景下的票据字符分割方法 总被引:2,自引:0,他引:2
针对票据字符识别中图像存在的底纹、印章和图案等复杂背景干扰问题,提出一种有效的字符分割方法。通过快速提升小波变换提取出图像中具有显著性的字符纹理特征。采用一种由粗到精的搜索策略,在图像区域和像素两个层次上逐步区分出文字和背景。首先根据区域纹理特征,利用支持向量机对区域进行分类,定位出包含文字的图像区域;然后采用K-means算法对文字区域内的像素进行聚类划分,从而实现文字分割。实验结果表明,方法具有较高的准确性,并且在背景纹理和印章干扰的情况下具有较好的鲁棒性。 相似文献
17.
互联网中中文地址文本蕴含着丰富的空间位置信息,为了更加有效地获取文本中的地址位置信息,提出一种基于地址语义理解的地址位置信息识别方法。通过对训练语料进行词频统计,制定地址要素特征字集合和字转移概率,构造特征字转移概率矩阵,并结合字符串最大联合概率算法,设计了一种不依赖地名词典和词性标注的地址识别方法。实验结果表明,该方法对地址要素特征字突出且存在歧义的中文地址的完全匹配率为76.85%,识别准确率为93.11%。最后,与机械匹配算法和基于经验构造转移概率矩阵的方法进行对比实验,实验结果表明了该方法的可用性和有效性。 相似文献
18.
针对文本图像倾斜检测的问题, 提出了一种新的基于几何约束的文本图像倾斜角自动检测算法。该算法采用边界标记自动机的方法对一组同行字符轮廓进行检测从而得到该组字符轮廓的最低点信息, 再用矩的方法剔除噪声字符, 并确定页面的倾斜角度。实验结果表明, 该算法在检测效率与准确率上都有了明显的提高, 同时在处理较大倾斜角和较少字符数目的倾斜检测中也有较好的执行效率。因此, 该算法可广泛应用于包括英文、中文、日文在内的多种语言文本图像的倾斜检测中。 相似文献