首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 158 毫秒
1.
一种基于内容的文档图像检索方法   总被引:1,自引:0,他引:1  
使用一个图像作为查询检索输入,根据该图像的版面分析特征、统计特征、纹理特征与数据库中图像的相似程度检索图像.该检索方法首先利用数学形态学对文档图像进行段落分割和行分割,作为文档图像的版面结构特征;然后根据图像的统计特征包括字符数、统计数特征、纹理特征给出文档图像抽取算法;最后给出检索算法模型.实验结果表明,本算法具有较好的查准率和查全率,在基于内容的文档图像检索中具有应用价值.  相似文献   

2.
目的 在将纸张文档数字化的过程中,解决中文文档版面信息的自动提取与恢复问题.方法 通过搜索连通域,并根据连通域的尺寸特征,优先提取非文本区域,对提取出来的非文本区域,根据投影直方图、宽高比和黑白像素比等特征区分出表格、直线和图像;对文本区域采用改进的基于投影的纵横切割法来达到对文本正确分割的目的;利用XML文档文件格式描述、组织、恢复原有版面的数据和样式.通过重构生成保持原版面格式的通用电子文档,达到"原文重现"的目的.结果 对大量的书籍样张和带表格、图像以及横竖混排等复杂样张的试验,结果 表明改进的版面分析方法分割准确,速度快;基于XML技术的重构方法实现了对文档版面较精确的重构.结论 采用统计特征得出的阈值参数用在了改进的版面分析方法中,提高了系统的适应性.该方法对较规范的文档效果较好,对复杂版面在一定的人工干预下基本可以适用.  相似文献   

3.
机器视觉技术是计算机科学的重要研究领域,其中背景图像中字符的提取和识别有重大的研究意义.通过分析复杂背景中字符存在的特点,针对快速分割和识别的应用需求,提出了一种在色调上将阀值法和区域生长法相结合的分割方法.  相似文献   

4.
提出了一种基于基本图像特征、适用于不同分辨率自然文本图像的中朝文种辨识方法.在训练阶段,首先构造标准文字图像库,然后提取文字的形态学骨架,最后利用骨架的基本图像特征来训练BP神经网络;在辨识阶段,首先对自然文本图像进行倾斜校正后做二值化处理以提高字符分割的效果,然后进行垂直投影、水平投影、字符分割和提取每个字符的骨架信息,最后基于字符骨架的基本图像特征利用BP神经网络来进行文种辨识.实验表明,本文提出的方法在中朝文种辨识中综合辨识准确率可达到87%.  相似文献   

5.
目的 将数据分析技术应用到字符图像的切分中,有效地提高字符切分的正确率.方法 通过分析文本行高、文本行间距、字符单元间距和字符单元宽度等数据,发现异常数据(噪声),分析产生异常的原因.通过拆分、合并区域消除异常来达到准确切分字符的目的.结果 对大量的普通文本图像的试验。结果表明该方法是有效的.结论 该方法能处理决大多数情况及一些特殊的情况,如一行文本被错误的切分为两行,字符图像在预处理过程中的断裂及粘连,等等,提高字符图像的切分正确率。  相似文献   

6.
基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索,输出相似度超过阈值的候选段落;最后,通过仿真实验验证了该方法的有效性.实验结果表明,该算法可以根据段落的语义进行文档的搜索,可以为查询大容量文档提供有效的手段.  相似文献   

7.
针对药瓶标签的特点,对字符定位、字符分割、字符识别等多个环节进行了深入研究,设计了一种字符识别系统。对药瓶标签图像进行预处理,为后续药品标签上字符的定位做准备。用轮廓跟踪法定位字符所在的大致区域,采用水平投影结合图像分割方法精确定位字符区域。利用垂直投影法定位字符中的粘连块,并进一步利用滴水算法分割粘连字符。选用K-L变换对粗分类后的子类提取字符特征,选用一种自适应调节学习率和动态调整S型激励函数相结合的改进BP算法对字符进行精确识别。实验证明本系统能够快速、高效地识别出药瓶标签上的字符,有实用价值。  相似文献   

8.
通过对颜色直方图的研究,提出一种新的物流车辆颜色量化的方法和灰度共生矩阵的计算方法,并且采取一种快速分割方法对图像进行分割,在分割区域颜色直方图计算时,提出粗粒度的概念,从而改善了检索的精度和提高了检索的速度。提出主区域的概念,对主区域进行颜色、纹理、形状等特征的提取,完成兼容彩色和灰度图像的检索,并通过仿真实验证明该算法的可行性和高效性。  相似文献   

9.
提出了一种基于数学形态学的多特征车牌定位方法和基于模糊模板匹配及垂直投影的字符分割算法,先通过形态学运算得到一系列候选区域,根据车牌的纹理特征从中找出车牌区域,再利用模糊模板匹配的方法找到字符区域,进而根据字符垂直投影进行单个字符分割.对大量的图片进行实验,结果表明该算法能够有效地解决复杂背景下车牌定位和字符分割困难的问题,具有较好的鲁棒性.  相似文献   

10.
自动定位彩色图像中的文本   总被引:2,自引:0,他引:2  
提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜色图像分解方法提取具有相似颜色的连通区域,通过聚类相邻的连通区域得到文本的位置和范围.利用一个图像数据库来测试本文算法,试验表明算法具有较高的正确率.  相似文献   

11.
TwoTypesofFeaturesandTheirExtractionsinHandwritenChineseCharacterRecognitionSHIDaming(石大明)TANGXianglong(唐降龙)LIUJiafeng(刘家锋)SH...  相似文献   

12.
针对数字图书馆中信息资源检索效率低的问题,提出了一种新的文档图像检索算法.首先,根据文档图像自身的特点,结合人眼的视觉特性,提取文档图像中的边缘信息,在此基础上,构造有意义的纹理特征,利用纹理特征来定义文档图像的特征描述符,以描述符为线索,将文档图像的内容特征有机结合,并采用合适的相似性度量准则用于高效的检索.实验结果表明,该算法不仅具有较高的检索效率,而且也降低了传统文档图像检索算法的复杂度.  相似文献   

13.
文章讨论了易碎数字水印在数字图象防篡改中的应用,提出了一种新的混沌易碎数字水印算法以及相应的篡改检测方法。构造了一种新的水印预处理的方法,使处理后的水印信号具有对初值敏感的混沌特性。在图象离散小波域的低频中嵌入混沌水印信号,可以检测图象的局部变化,给出篡改相应的位置信息,并且对有损压缩和加噪有一定的抵抗能力。实验仿真证明该方法是有效的。  相似文献   

14.
通过提取如图像的颜色、纹理、形状和空间关系等底层特征来建立索引,然后通过计算比较这些特征和查询条件之间的相似度来判断2个图像的相似程度,将相似度较高的图像显示给用户,进而完成图像检索.通过以建立医学图像的特征矢量作为其索引,使用医学图像的多维特征进行相似查询,可提高临床医师的确诊率.  相似文献   

15.
基于模板匹配的抗几何攻击图像数字水印   总被引:11,自引:0,他引:11  
数字水印技术是解决数字化时代数字作品版权保护的一个重要手段,衡量数字水印技术先进可靠的标准是能否抵抗各种水印攻击,图像水印的抗几何攻击一直是图像数字水印技术的研究热点,并且远没有达到实际应用的要求,本文提出了基于模板匹配抗几何攻击图像数字水印技术,该技术向图像中嵌入两种水印:模板水印和鲁棒水印,模板水印用来检测图像所经历的几何变换;鲁棒水印用来标识作品的著作权,以作为版权纠纷的证据,对于有版权纠纷的作品,先进行模板水印搜索,测量出图像所经历的几何变换,之后再提取鲁棒水印,区域水印嵌入方法的提出,进一步提高了水印检测的准确性,试验表明该技术能够很好地抵抗诸如旋转、缩放、剪切和平移等几何攻击以及JPEG有损压缩。  相似文献   

16.
数码相机拍摄的文本图像的二值化   总被引:5,自引:4,他引:1  
提出了一种数码相机拍摄的文本图像的二值化方法,该方法是全局阈值、局部阈值与灰度梯度方法的结合。全局阈值与局部阈值的结合能较好地保留字符的笔画细节,灰度梯度方法能增强字符的笔画轮廓,实验结果表明该方法是有效的。  相似文献   

17.
针对同一色彩在不同显示器之间呈现出的差异,根据显示器色彩管理的基本原理和规范化应用流程,通过实验测量对显示器及显示器色彩管理文件进行了校正和规范,并对显示器特性文件进行质量评价,结果表明应用色彩管理在数字化流程中会使显示器获得更好的显示效果。  相似文献   

18.
数字照片中的汉字经过数码相机拍摄都会符合一定的投影规则,经过变造篡改的汉字则存在一定程度的投影偏差.为了检测数字图像中汉字信息的真实性,对估算汉字投影偏差法进行了研究,提出了基于相机标定来估算投影偏差值的检测技术.结合汉字具有平面方块的特点,利用汉字模型代表真实世界坐标系下被拍摄的汉字,提取一定数量的对应点坐标,获取与图像实际单应性矩阵对应的投影矩阵,求解重构汉字的偏差值.通过实验确定偏差阈值,图像中汉字投影偏差值大于阈值则认为经过变造篡改.实验结果表明,该方法能检测重新写入图像的汉字和替换图像汉字的篡改.  相似文献   

19.
实现了一个利用小世界网络模型(SWN)提取中文文档的关键字的系统。小世界网络模型具有两个统计性质:平均路径长度和聚类系数。本系统使用的算法首先对文档进行分词,以分词之间的相邻关系为边、以分词为节点构造文档结构图。然后计算每一个分词的平均路径长度变化量和聚类系数变化量,并且使用这两个变化量作为提取关键字的标准,最后按照一定策略合并关键字成复合关键字。本文首先详细介绍了小世界网络模型的概念和在关键字提取方面的应用,然后介绍了本系统的设计与实现,最后通过实验证明了该算法的正确性和有效性。  相似文献   

20.
提出一种基于背景规范化的照相文本图像二值方法.通过方差计算确定文本图像的文字区域,并对文字区域进行背景插值后得到原始文本图像的背景图.根据背景图把原始文本图像转换成背景规范化的文本图像,同时用拟合曲线对不同明暗背景区实行相应的对比度补偿,把前景像点与背景像点设置到较小的灰度范围,然后用全局阈值方法进行二值化处理.试验结果表明,该方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号