期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于多特征和SVM的文本图像版面分类方法 总被引：1，自引：0，他引：1

程娟平西建周冠玮《数据采集与处理》2008,23(5)

对文本图像的灰度、形状和纹理等视觉特征进行了较为全面的分析,研究了版面中文本、表格、图形和图像在各种特征层面上的差异。针对中英文版面,结合投影法与连通域分析快速准确的分割图像,提取了能够表征区域信息的17维特征向量,然后使用基于正态决策树的多分类支持向量机将文本图像版面区域分为文本、表格、图形和图像四类。实验结果表明算法能够快速、准确地处理文本图像版面,具有较强的应用价值。相似文献

2.

改进的基于连通域的版面分割方法

于明郭佥王栋壮于洋《计算机工程与应用》2013,49(17):195-198

版面分割是版面分析的重要组成部分,经过大量的研究,如今已到了一个比较成熟的阶段。对基于连通域的版面分割算法进行了改进,能有效快速地分割较为复杂的版面图像,同时有效减少原有算法中阈值引起的分割错误的情况。先对文本图像进行单个字体的区域扩充,使后续的连通间距统计更为准确和方便,再通过连通间距的统计对图像进行模糊整合,进行文本图像的连通区域分割。实验结果表明,改进的基于连通域的算法分割版面准确,速度快,适用范围广,对于较为复杂的版面分割更具有优越性。相似文献

3.

一种基于连通域的版面分割方法 总被引：4，自引：0，他引：4

郭丽孙兴华王正群杨静宇《计算机工程与应用》2003,39(5):105-107

版面分割是版面分析的重要组成部分,是一个受到广泛关注的研究课题。该文提出了一种基于连通域的版面分割算法,首先对文档图像进行倾斜校正,然后采用模糊处理以得到较大的连通单元,再根据区域连通的特性进行版面分割和处理。实验表明,基于连通域的算法分割版面准确,速度快,适用范围广,不仅可用于矩形版面,对于非Manhattan版面等复杂版面也能取得令人满意的效果。相似文献

4.

基于最小生成树聚类的中文版面分割法 总被引：1，自引：1，他引：0

下载免费PDF全文

张充苗秀芬司建辉史青宣田学东《计算机工程》2008,34(15):211-213

针对中文版面多横竖混排的特点,提出一种基于最小生成树聚类的版面分割方法。对原图像进行水平和垂直游程平滑,并对平滑后所得的连通域进行预分类处理,将文本进行横排、竖排分类。对预分类后的各类文本采用最小生成树聚类算法进行聚类处理。经实验,准确率达97%。实验表明,该方法对中文文档有良好的分割效果。相似文献

5.

基于RGB分量统计的可变区域彩色图像分割算法*

王志良高晓亮王鲁《计算机应用研究》2010,27(11):4341-4344

为了能够对彩色图像进行高效的分割,提出了一种可变区域的图像分割算法,利用基于图像全局RGB分量统计信息的活动轮廓模型进行曲线演化,并使用水平集表示轮廓。通过改变和缩小分割区域的策略,将分割过程分为多个阶段进行。在灰度图像的分割算法的基础上,将可变区域策略拓展到彩色图像。实验结果表明,图像中多连通区域的物体能够被准确且快速地分割出来。与现有模型相比,可以自动地完成工作而无须人工干预,并且算法快速方面有明显的改进。相似文献

6.

基于连通域分析和支持向量机的传真图像关键词定位

蔡锋刘立柱《计算机应用》2010,30(5):1259-1261

电话号码区域定位是传真图像电话号码识别中的关键技术之一。首先采用连通域分析对传真图像实现较为精确的版面分析,形成比较完整的单词连通域,提取单词连通域的水平穿越次数和空间分布特征,形成51维的特征向量。采用基于正态决策树的多分类支持向量机(SVM),来完成对传真图像电话号码区域关键词的定位。实验结果表明,算法能够快速有效地完成关键词的定位,具有较强的实用价值。相似文献

7.

一种基于形态运算的快速文字分割算法

何家颖黎绍发《计算机工程与科学》2005,27(9):64-65

本文针对复杂背景图像中文字与背景区域的形态特征,提出了一种基于形态运算和区域生长的快速文字分割算法MOSA,同时将之与LLT分割算法进行了比较。实验结果表明,该算法能较快和较准确地定位复杂背景图像中的文字区域,并且相对于LLT算法,该算法在速度与分割效果方面都有所提高。相似文献

8.

改进图割的显著性区域检测算法 总被引：1，自引：0，他引：1

朱驰陈昌志王宁安世全《计算机工程与设计》2015,(6)

为快速准确地提取图像中的显著性区域,提出一种改进图割的显著性区域检测算法。采用改进的图割算法对图像进行预分割,将图像分成若干子区域,在此基础上利用区域间对比度计算各区域的显著性值,得到图像的显著图,利用迭代阈值分割算法对图像显著图进行分割处理,通过图像去噪完整有效地提取出显著性区域。实验结果表明,该算法能够准确地提取出图像中的显著性区域,与传统方法相比,使用该算法提取出的显著性区域更完整、准确,提高了效率。相似文献

9.

基于汉字连通分量的印刷图像版面分割方法

付芦静钱军浩钟云飞《计算机工程与应用》2015,51(5):178-182

针对彩色印刷图像背景色彩丰富和汉字存在多个连通分量,连通域文字分割算法不能精确提取文字,提出基于汉字连通分量的彩色印刷图像版面分割方法。利用金字塔变换逆半调算法对图像进行预处理,通过颜色采样和均值偏移分割图像颜色,标记文字连通分量,根据汉字结构和连通分量特性重建汉字连通分量,分析文字连通分量连接关系确定文字排列方向实现文字分割。实验结果表明,该方法能够有效地重建汉字连通分量,在彩色印刷图像中实现对不同字体、字号、颜色的文字分割。相似文献

10.

基于连通域的快速文字图像分割算法

林孜阳穆雪吴凯锋严寒林怡芳《计算机光盘软件与应用》2014,(22):89-90

针对文本图像中的文字难以提取分割的问题,文章提出了一种基于连通域的算法。算法通过连通域阀值分析,将文本块联通,继而将文字成功分割。实验结果表明本算法能快速准确地分割文字。相似文献

11.

基于改进MRF的遥感影像建筑物精提取

朱恰王建刘星雨周再文马紫雯高贤君《计算机与现代化》2020,(7):104-110

随着遥感图像的快速发展与广泛应用,基于遥感影像的建筑物提取能够及时、准确地提取建筑物信息,在地图快速更新、城市管理等应用中具有重要的研究意义。目前经神经网络进行特征分析提取的建筑物灰度图存在图像模糊、错分建筑物等情况,并且需要经过二值化处理才能为后续工作所利用。为了提高分类精度,本文在神经网络初提取的基础上,首先采取大津法分割,形态学处理灰度图。并改进马尔可夫随机场方法,提出根据图像局部邻域特征动态估计先验参数β的新方法,且将原始图像特征引入马尔可夫随机场,对大津法分割的结果进行进一步的分割,并对建筑物边缘的锯齿边界进行修正,以提高分类精度。实验表明,所用方法能够有效减少神经网络提取出的灰度图中的错分建筑物。相似文献

12.

Hierarchical content classification and script determination for automatic document image processing

Zheru ChiAuthor Vitae Qing WangAuthor Vitae Wan-Chi SiuAuthor Vitae 《Pattern recognition》2003,36(11):2483-2500

相似文献

13.

An object-based and heterogeneous segment filter convolutional neural network for high-resolution remote sensing image classiﬁcation

Xin Pan Jian Zhao Jun Xu 《International journal of remote sensing》2019,40(15):5892-5916

In recent years, object-based segmentation methods and shallow-model classification algorithms have been widely integrated for remote sensing image supervised classification. However, as the image resolution increases, remote sensing images contain increasingly complex characteristics, leading to higher intraclass heterogeneity and interclass homogeneity and thus posing substantial challenges for the application of segmentation methods and shallow-model classification algorithms. As important methods of deep learning technology, convolutional neural networks (CNNs) can hierarchically extract higher-level spatial features from images, providing CNNs with a more powerful recognition ability for target detection and scene classification in high-resolution remote sensing images. However, the input of the traditional CNN is an image patch, the shape of which is scarcely consistent with a given segment. This inconsistency may lead to errors when directly using CNNs in object-based remote sensing classification: jagged errors may appear along the land cover boundaries, and some land cover areas may overexpand or shrink, leading to many obvious classification errors in the resulting image. To address the above problem, this paper proposes an object-based and heterogeneous segment filter convolutional neural network (OHSF-CNN) for high-resolution remote sensing image classi?cation. Before the CNN processes an image patch, the OHSF-CNN includes a heterogeneous segment filter (HSF) to process the input image. For the segments in the image patch that are obviously different from the segment to be classified, the HSF can differentiate them and reduce their negative influence on the CNN training and decision-making processes. Experimental results show that the OHSF-CNN not only can take full advantage of the recognition capabilities of deep learning methods but also can effectively avoid the jagged errors along land cover boundaries and the expansion/shrinkage of land cover areas originating from traditional CNN structures. Moreover, compared with the traditional methods, the proposed OHSF-CNN can achieve higher classification accuracy. Furthermore, the OHSF-CNN algorithm can serve as a bridge between deep learning technology and object-based segmentation algorithms thereby enabling the application of object-based segmentation methods to more complex high-resolution remote sensing images. 相似文献

14.

基于自适应特征与多级反馈模型的中英文混排文档分割 总被引：2，自引：0，他引：2

夏勇王春恒戴汝为《自动化学报》2006,32(3):353-359

提出了一种基于自适应特征与多级反馈模型的新颖的字符分割方法,对文字图像质量与中英文混排格式有较好的自适应能力．该方法的主要思想就是将一个分割过程分成很多层,每层都会由一个主要特征来指导字符分割与中英文预分类,然后将分割层的结果反馈至当前分割层或前面的分割层,并指导下一层的分割．该方法将字符分割、中英文预分类和字符识别这三者进行了很好的融合,大大提高了字符分割与识别的正确率．相似文献

15.

结合超像元和子空间投影支持向量机的高光谱图像分类

下载免费PDF全文

冉琼于浩洋高连如李伟张兵《中国图象图形学报》2018,23(1):95-105

目的高光谱图像包含了丰富的空间、光谱和辐射信息,能够用于精细的地物分类,但是要达到较高的分类精度,需要解决高维数据与有限样本之间存在矛盾的问题,并且降低因噪声和混合像元引起的同物异谱的影响。为有效解决上述问题,提出结合超像元和子空间投影支持向量机的高光谱图像分类方法。方法首先采用简单线性迭代聚类算法将高光谱图像分割成许多无重叠的同质性区域,将每一个区域作为一个超像元,以超像元作为图像分类的最小单元,利用子空间投影算法对超像元构成的图像进行降维处理,在低维特征空间中执行支持向量机分类。本文高光谱图像空谱综合分类模型,对几何特征空间下的超像元分割与光谱特征空间下的子空间投影支持向量机（SVMsub）,采用分割后进行特征融合的处理方式,将像元级别转换为面向对象的超像元级别,实现高光谱图像空谱综合分类。结果在AVIRIS（airbone visible/infrared imaging spectrometer）获取的Indian Pines数据和Reflective ROSIS（optics system spectrographic imaging system）传感器获取的University of Pavia数据实验中,子空间投影算法比对应的非子空间投影算法的分类精度高,特别是在样本数较少的情况下,分类效果提升明显;利用马尔可夫随机场或超像元融合空间信息的算法比对应的没有融合空间信息的算法的分类精度高;在两组数据均使用少于1%的训练样本情况下,同时融合了超像元和子空间投影的支持向量机算法在两组实验中分类精度均为最高,整体分类精度高出其他相关算法4%左右。结论利用超像元处理可以有效融合空间信息,降低同物异谱对分类结果的不利影响;采用子空间投影能够将高光谱数据变换到低维空间中,实现有限训练样本条件下的高精度分类;结合超像元和子空间投影支持向量机的算法能够得到较高的高光谱图像分类精度。相似文献

16.

基于分数阶微分增强的肺CT图像血管分割

赖均解梅《计算机应用》2011,31(4):1027-1029

为了提高对肺CT图像中血管自动分割的准确性,提出基于分数阶微分增强的局部子区域分割方法。通过对肺CT图像的增强、分割方法和分数阶微分对图像细微细节的增强能力的比较和研究后, 该方法先采用构建的分数阶微分算子对肺CT图像加以增强后, 再用两个控制指标获取的局部区域最优阈值来分割肺血管。实验结果表明, 它可以有效地提取肺血管网络并且能够分割得到更为丰富的血管细节; 对比传统方法的肺血管分割结果,它能更准确地分割出肺CT图像中的血管。相似文献

17.

Multispectral image segmentation by a multichannel watershed‐based approach

P. Li X. Xiao 《International journal of remote sensing》2013,34(19):4429-4452

Watershed transformation in mathematical morphology is a powerful morphological tool for image segmentation that is usually defined for greyscale images and applied to the gradient magnitude of an image. This paper presents an extension of the watershed algorithm for multispectral image segmentation. A vector‐based morphological approach is proposed to compute gradient magnitude from multispectral imagery, which is then input into watershed transformation for image segmentation. The gradient magnitude is obtained at multiple scales. After an automatic elimination of local irrelevant minima, a watershed transformation is applied to segment the image. The segmentation results were evaluated and compared with other multispectral image segmentation methods, in terms of visual inspection, and object‐based image classification using high resolution multispectral images. The experimental results indicate that the proposed method can produce accurate segmentation results and higher classification accuracy, if the scales and contrast parameter are appropriately selected in the gradient computation and subsequent local minima elimination. The proposed method shows encouraging results and can be used for segmentation of high resolution multispectral imagery and object based classification. 相似文献

18.

朝汉混排古籍的文字切分方法

下载免费PDF全文

刘星辰金小峰《计算机工程与应用》2020,56(11):135-141

为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法。针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法。利用连通域的删除、合并、拆分等操作对文字进行切分。使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作。对于粘连字,采用改进的滴水算法进行有效切分。实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作。该算法的列切分准确率为97.69%,字切分准确率为87.79%。相似文献

19.

基于自监督学习的病理图像层次分割

吴崇数林霖薛蕴菁时鹏《计算机应用》2020,40(6):1856-1862

在苏木精-伊红(HE)染色病理图像中，细胞染色分布的不均匀和各类组织形态的多样性给病理图像的自动分割带来极大挑战。为解决该问题，提出了一种基于自监督学习的病理图像三步层次分割方法，对病理图像中各类组织进行由粗略到精细的全自动逐层分割。首先，根据互信息的计算结果在RGB色彩空间中进行特征选择；其次，采用K-means聚类将图像初步分割为各类组织结构的色彩稳定区域与模糊区域；然后，以色彩稳定区域为训练集采用朴素贝叶斯分类对模糊区域进行进一步分割，得到完整的细胞核、细胞质和胞外间隙这三类组织结构；最后，对细胞核部分进行结合形状和色彩强度的混合分水岭分割得到细胞核间的精确边界，进而量化计算细胞核个数、核占比、核质比等指标。对脑膜瘤HE染色病理图像的分割实验结果表明，所提方法对于染色和细胞形态差异保持较高的鲁棒性，各类组织区域分割误差在5%以内，在细胞核分割精度的对比实验中平均正确率在96%以上，满足临床自动图像分析的要求，其量化结果可以为定量病理分析提供依据。相似文献

20.

A robust system for document layout analysis using multilevel homogeneity structure

《Expert systems with applications》2017

One of the difficulties in the understanding of document images is document layout analysis, which is the first step in document image modeling. In this paper, a robust system for which a multilevel-homogeneity structure is used in accordance with a hybrid methodology is proposed to deal with this problem. Our system consists of the following three main stages: classification, segmentation, and refinement and labeling. Different from other page segmentation methods, the proposed system includes an efficient algorithm to detect table regions in document images. Besides, to create an effective application, the proposed system is designed to work with a variety of document languages. The proposed method was tested with the ICDAR2015 competition (RDCL-2015) and three other published datasets in different languages. The results of these tests show that the accuracy of proposed system is superior to the previous methods. 相似文献