首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
针对现有基于图像文档转换为文本后进行文档检索的方法,无法满足当今超大量数字图像库的处理场景。文中提出一种基于文本布局块的文档图像检索方法。根据文本布局块之间的距离特征,定义了新的距离函数,利用新的距离函数计算得到文本布局块之间的距离矩阵,并结合匈牙利算法求出文档图像的最佳匹配结果。通过大量实验证明,所提方法能够有效地提高图像文档检索准确度,并且能保证78.2%的正确率。  相似文献   

2.
针对当前企业对文档保密与检索功能的双重需求,提出一种添加模糊匹配Hubble.Net保密文档专用检索阅读方法.采用AES(Advanced Encryption Standard)加密算法对将加密文档提取的流信息流进行加密,使用Hubble.Net与对加密文档进行检索时,而模糊匹配算法的使用大大增加了字符比对的容错性,在保证文档加密的同时兼顾了文档位置定位、关键字定位等文档检索功能.在检索速度及精度方面,要优于现有的方法.  相似文献   

3.
黄霞 《电子学报》2014,42(2):288-291
提出一种基于领域本体潜在语义索引和奇异值分解的图像数据查询算法,将查询扩展向量映射到潜在语义空间,根据相似度计算方法计算查询向量与图像文档之间的相似度,并将相似度大于阀值的文档作为检索结果降序排列返回给用户.该算法能更有效地提高图像检索的查准率和查全率.  相似文献   

4.
文中研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对图像搜索引擎检索模式分析的基础上,提出了若干关键技术,设计并实现了一个基于文本的Web图片搜索引擎,给出了系统的总体结构图.并对获取网页、提取信息、图片抓取、建立索引和提供查询进行了详细的描述,分析了图像搜索引擎的检索模式。  相似文献   

5.
《现代电子技术》2017,(5):33-37
为了提高多模态检索的性能,提出一种多模态文档语义生成模型以及基于该模型的多模态数据联合检索算法。多模态文档语义生成模型认为文档中每个模态数据都是由相同的语义概念生成的,并且文档是多个模态数据的联合分布。为了简化模型的求解过程,假设各个模态数据之间的生成过程是相互独立的,于是可以对每个模态的条件概率进行单独计算。在多模态联合检索中,通过计算查询数据和待检索文档的联合概率来计算它们之间的相似度。实验结果表明,提出的方法与两步检索、语义索引和排序学习三种多模态检索方法相比具有更好的检索性能。此外,该方法可以扩展应用到具有三个及以上模态数据的文档联合检索中。  相似文献   

6.
基于版面的拍照文档图像倾斜校正   总被引:1,自引:1,他引:0  
荆雷  张欣  郭金鑫 《激光与红外》2010,40(10):1116-1120
文档图像版面十分复杂,建立一个较为通用的文档图像倾斜校正算法是很困难的。因此提出了基于版面的文档图像倾斜自动校正算法,并且对经典的霍夫变换检测直线的方法进行了改进,最后采用最小距离法对这些直线进行拟合,避免了因利用传统的最小二乘法拟合直线所带来的缺点。针对不同的文档版面采用相应的倾斜校正策略,实验表明该方法具有适应性强、倾斜校正速度快和精度高的特点。  相似文献   

7.
数学公式识别是将中文电子文档中包含的数学公式识别出来的方法.印刷体文档中的数学公式识别是由预处理,数学公式的抽取分割定位和结构分析识别3部分组成.主要介绍了目前数学公式识别的研究现状,并对已提出的各种成熟识别方法进行总结.  相似文献   

8.
在对涉密企业信息化调研与文本检索研究的基础上,结合涉密企业信息化的特殊要求与文本检索的优势,提出了将文本检索应用于信息化的系统设计。该系统分为词法语法分析层、核心接口层和存储层3个层次。它能够处理中英文文档并可以扩展到其他语言,支持多种不同的检索方案,提供了一个通用的接口来识别不同的数据源。并依次讨论了该系统中的文档采集、文档对象、查询分析器、用户查询条件匹配及检索接口等模块。  相似文献   

9.
针对文档图像查重、以图搜索文档等应用对于文档图像提取的需求,文中归纳和总结了Word和PDF文档图像的提取方法。这两类文档图像的提取方法都是从文件结构出发,定位并提取出图像数据,然后将数据保存成指定格式的图像。在PyCharm环境下采用Python语言对提取方法进行封装,设计并实现了一个面向Word和PDF文档的图像提取软件,实验验证了文档图像提取方法的有效性。  相似文献   

10.
行人重识别的目的是在跨区域、跨场景的情况下,检索出特定目标行人.由于行人外观可能相似,以及存在姿态变化和遮挡的问题,因此要求行人重识别模型能够捕捉到足够的细节信息.基于此,提出了图像特征融合的行人重识别算法,融合图像的全局特征与局部特征进行目标行人的检索.该算法构建了特征融合的图像通道,由卷积神经网络提取图像的视觉信息...  相似文献   

11.
Image retrieval has lagged far behind text retrieval despite more than two decades of intensive research effort. Most of the research on image retrieval in the last two decades are on content based image retrieval or image retrieval based on low level features. Recent research in this area focuses on semantic image retrieval using automatic image annotation. Most semantic image retrieval techniques in literature, however, treat an image as a bag of features/words while ignore the structural or spatial information in the image. In this paper, we propose a structural image retrieval method based on automatic image annotation and region based inverted file. In the proposed system, regions in an image are treated the same way as keywords in a structural text document, semantic concepts are learnt from image data to label image regions as keywords and weight is assigned to each keyword according to spatial position and relationship. As the result, images are indexed and retrieved in the same way as structural document retrieval. Specifically, images are broken down to regions which are represented using colour, texture and shape features. Region features are then quantized to create visual dictionaries which are similar to monolingual dictionaries like English or Chinese dictionaries. In the next step, a semantic dictionary similar to a bilingual dictionary like the English–Chinese dictionary is learnt to mapping image regions to semantic concepts. Finally, images are then indexed and retrieved using a novel region based inverted file data structure. Results show the proposed method has significant advantage over the widely used Bayesian annotation models.  相似文献   

12.
13.
Using the prototype electronic document storage and retrieval (EDSR) system as a testbed, the Ethernet-based image transmission protocol is demonstrated to be a fast, reliable, and efficient mechanism for transmitting document image files among AT-class computers. The principal bottleneck in the server's performance, i.e. the rate at which data are read from the optical disk via the SCSI host adapter, has been identified and corrected. The transfer rate is expected to increase from approximately 60 kb/s to approximately 480 kb/s, and 800% improvement. A method is suggested for designing a network to support multiuser access to a document image database on optical disks. Depending on the final service rate and the rate at which actual users request images, a network with up to five servers should be able to support from five to ten users per server  相似文献   

14.
利用隐马尔可夫模型(HMMs) ,对CCD摄像机采集的人体运动视频图像中的人体姿态识别问题进行了研究,主要内容包括选择新的特征向量抽取算法;设计HMM训练和识别算 法。实验结果表明,该方法在实践中是可行的。在虚拟现实、视觉监控、感知接口等领域均有着广阔的应用前景。  相似文献   

15.
Documentation image processing, an important information service made possible by greater network bandwidth and optical storage capacities in public communications networks, is discussed. Document image technology converts physical records and documents into digitized images for task processing and archival storage on magnetic or optical media. Imaging systems facilitate rapid retrieval and efficient document flow among users connected to information networks, replacing traditionally manual processes with a more efficient mechanized work flow. The customer requirements for document image processing, telephone company capabilities, and a typical example of customer document imaging are presented  相似文献   

16.
Our starting point is gradient indexing, the characterization of texture by a feature vector that comprises a histogram derived from the image gradient field. We investigate the use of gradient indexing for texture recognition and image retrieval. We find that gradient indexing is a robust measure with respect to the number of bins and to the choice of the gradient operator. We also find that the gradient direction and magnitude are equally effective in recognizing different textures. Furthermore, a variant of gradient indexing called local activity spectrum is proposed and shown to have improved performance. Local activity spectrum is employed in an image retrieval system as the texture statistic. The retrieval system is based on a segmentation technique employing a distance measure called Sum of Minimum Distance. This system enables content-based retrieval of database images from templates of arbitrary size.  相似文献   

17.
综合语义与颜色特征的图像检索技术研究   总被引:2,自引:2,他引:0  
针对多媒体搜索引擎系统中的图像检索技术,本文提出了应用图像的高层语义特征和底层颜色特征作为图像检索的综合指标,将图像文本和视觉信息融合起来,给出了一种综合语义和颜色特征的图像检索系统的体系架构.以填补多媒体底层特征和高层语义之间的差异,并在此基础上提出了相关算法,使图像检索能够满足用户的需求.提高图像检索的效率和精度。  相似文献   

18.
李宗  徐家品 《通信技术》2012,45(4):80-82
根据图像内容质量对图像进行区分处理,可以有效地提高图像搜索效率。该文提出一种图像评价方法,专注于改善不同质量图像对搜索效率的影响。该方法基于图像颜色丰富程度、局部特征丰富程度以及是否背景丰富、是否包含多个子图等信息进行综合质量评价处理。实验结果表明,该方法时间效率很高,可以和图像搜索系统有效结合,有效改善图像搜索系统的搜索召回率和准确率。  相似文献   

19.
基于分块颜色特征和相关反馈的图像检索技术   总被引:1,自引:0,他引:1  
李雪艳 《电视技术》2013,37(7):29-32
在基于内容的图像检索(CBIR)中,对于传统的颜色直方图完全没有空间分布信息,提出了一种新的分块划分,并且结合颜色特征的图像检索方法。该方法结合了图像的整体与分块颜色分布,两幅图像之间的相似度为整体相似度和分块局部相似度的加权和,并且在检索中加入相关反馈技术,针对检索结果适当地调整权值,以达到更新图像整体与局部颜色特征的权重的目的。最后,实验结果表明该算法能很好地提高检索性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号