期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

Text detection in images using sparse representation with discriminative dictionaries 总被引：2，自引：0，他引：2

Ming Zhao Shutao Li James Kwok 《Image and vision computing》2010

Text detection is important in the retrieval of texts from digital pictures, video databases and webpages. However, it can be very challenging since the text is often embedded in a complex background. In this paper, we propose a classification-based algorithm for text detection using a sparse representation with discriminative dictionaries. First, the edges are detected by the wavelet transform and scanned into patches by a sliding window. Then, candidate text areas are obtained by applying a simple classification procedure using two learned discriminative dictionaries. Finally, the adaptive run-length smoothing algorithm and projection profile analysis are used to further refine the candidate text areas. The proposed method is evaluated on the Microsoft common test set, the ICDAR 2003 text locating set, and an image set collected from the web. Extensive experiments show that the proposed method can effectively detect texts of various sizes, fonts and colors from images and videos. 相似文献

2.

Learning low-rank and discriminative dictionary for image classification

Liangyue Li Sheng Li Yun Fu 《Image and vision computing》2014

Dictionary learning plays a crucial role in sparse representation based image classification. In this paper, we propose a novel approach to learn a discriminative dictionary with low-rank regularization on the dictionary. Specifically, we apply Fisher discriminant function to the coding coefficients to make the dictionary more discerning, that is, a small ratio of the within-class scatter to between-class scatter. In practice, noisy information in the training samples will undermine the discriminative ability of the dictionary. Inspired by the recent advances in low-rank matrix recovery theory, we apply low-rank regularization on the dictionary to tackle this problem. The iterative projection method (IPM) and inexact augmented Lagrange multiplier (ALM) algorithm are adopted to solve our objective function. The proposed discriminative dictionary learning with low-rank regularization (D²L²R²) approach is evaluated on four face and digit image datasets in comparison with existing representative dictionary learning and classification algorithms. The experimental results demonstrate the superiority of our approach. 相似文献

3.

Gabor特征集结合判别式字典学习的稀疏表示图像识别

下载免费PDF全文

胡正平徐波白洋《中国图象图形学报》2013,18(2):189-194

稀疏编码中字典的选择无论对图像重建还是模式分类都有重要影响,为此提出Gabor特征集结合判别式字典学习的稀疏表示图像识别算法.考虑到Gabor局部特征对光照、表情和姿态等变化的鲁棒性,首先提取图像对应不同方向、不同尺度的多个Gabor特征;然后将降维的增广Gabor特征矩阵作为初始特征字典,通过对该字典的学习得到字典原子对应类别标签的新结构化字典,新字典中特定类的子字典对相关的类具有好的表示能力,同时应用Fisher判别约束编码系数,使它们具有小的类内散度和大的类间散度;最后同时用具有判别性的重构误差和编码系数来进行模式分类.基于3个数据库的实验结果表明本文方法具有可行性和有效性. 相似文献

4.

Learning descriptive visual representation for image classification and annotation

Zhiwu Lu Liwei Wang 《Pattern recognition》2015

相似文献

5.

Learning discriminative localization from weakly labeled data

Minh Hoai Lorenzo Torresani Fernando De la Torre Carsten Rother 《Pattern recognition》2014

Visual categorization problems, such as object classification or action recognition, are increasingly often approached using a detection strategy: a classifier function is first applied to candidate subwindows of the image or the video, and then the maximum classifier score is used for class decision. Traditionally, the subwindow classifiers are trained on a large collection of examples manually annotated with masks or bounding boxes. The reliance on time-consuming human labeling effectively limits the application of these methods to problems involving very few categories. Furthermore, the human selection of the masks introduces arbitrary biases (e.g., in terms of window size and location) which may be suboptimal for classification. We propose a novel method for learning a discriminative subwindow classifier from examples annotated with binary labels indicating the presence of an object or action of interest, but not its location. During training, our approach simultaneously localizes the instances of the positive class and learns a subwindow SVM to recognize them. We extend our method to classification of time series by presenting an algorithm that localizes the most discriminative set of temporal segments in the signal. We evaluate our approach on several datasets for object and action recognition and show that it achieves results similar and in many cases superior to those obtained with full supervision. 相似文献

6.

基于自适应相似组稀疏表示的图像修复算法

林金勇邓德祥颜佳林晓英《计算机应用》2017,37(4):1169-1173

针对图像修复结果中存在的结构连续性和纹理清晰性较差的问题,提出了一种基于自适应相似组的图像修复算法。区别于传统的以单一图像块或固定数目图像块作为修复单元的方法,该算法根据自然图像中纹理区和结构区的不同特点,自适应地选取不同数目的相似图像块,构造自适应相似组;然后以相似组作为基本单元,学习自适应字典,并构造基于稀疏表示的图像修复模型;最后,采用Split Bregman Iteration算法高效地求解目标代价函数。实验结果表明,与基于图像块的图像修复算法和图像块组稀疏表示（GSR）算法相比,该算法在峰值信噪比（PSNR）上平均提高了0.94~4.34 dB,在结构相似性指数（SSIM）上平均提高了0.0069~0.0345,同时,修复速度分别是对比算法的2.51倍和3.32倍。相似文献

7.

基于多标签判别字典学习的图像自动标注

杨晓玲李志清刘雨桐《计算机应用》2018,38(5):1294-1298

针对图像自动标注中底层视觉特征与高层语义之间的语义鸿沟问题,在传统字典学习的基础上,提出一种基于多标签判别字典学习的图像自动标注方法。首先,为每幅图像提取多种类型特征,将多种特征组合作为字典学习输入特征空间的输入信息;然后,设计一个标签一致性正则化项,将原始样本的标签信息融入到初始的输入特征数据中,结合标签一致性判别字典和标签一致性正则化项进行字典学习;最后,通过得到的字典和稀疏编码矩阵求解标签稀疏编向量,实现未知图像的语义标注。在Corel 5K数据集上测试其标注性能,所提标注方法平均查准率和平均查全率分别可达到35%和48%;与传统的稀疏编码方法（MSC）相比,分别提高了10个百分点和16个百分点;与距离约束稀疏/组稀疏编码方法（DCSC/DCGSC）相比,分别提高了3个百分点和14个百分点。实验结果表明,所提方法能够较好地预测未知图像的语义信息,与当前几种流行的图像标注方法进行比较,所提方法具有较好的标注性能。相似文献

8.

基于多视图特征投影与合成解析字典学习的图像分类

冯辉荆晓远朱小柯《计算机应用》2017,37(7):1960-1966

针对目前存在的合成解析字典学习方法不能有效地消除同类样本之间的差异性和忽略了不同特征对分类的不同影响的问题,提出了一种基于多视图特征投影与合成解析字典学习（MFPSDL）的图像分类方法。首先,在合成解析字典学习过程中为每种特征学习不同的特征投影矩阵,减小了类内样本间的差异对识别带来的影响;其次,对合成解析字典添加鉴别性的约束,使得同类样本具有相似的稀疏表示系数;最后通过为不同类型的特征学习权重,充分地融合多种特征。在公开人脸数据库（LFW）和手写体识别数据库（MNIST）上进行多项对比实验,MFPSDL方法在LFW和MNIST数据库上的训练时间分别为61.236 s和52.281 s,MFPSDL方法相比Fisher鉴别字典学习（FDDL）、类别一致的K奇异值分解（LC-KSVD）、字典对学习（DPL）等字典学习方法,在LFW和MNIST上的识别率提高了至少2.15和2.08个百分点。实验结果表明,所提方法在保证较低的时间复杂度的同时,获得了更好的识别效果,适用于图像分类。相似文献

9.

基于图像分解和稀疏表示的多聚焦图像融合

蒋留兵张点车俐《计算机应用研究》2021,38(8):2499-2504

针对多聚焦图像融合中缺乏细节保护和结构不连续的不足,提出了一种基于图像分解的多聚焦图像融合算法.首先,源图像采用卡通纹理图像分解得到卡通部分和纹理部分;其次,卡通部分采用卷积稀疏表示的方法进行融合,纹理部分采用字典学习进行融合;最后,将卡通和纹理部分融合得到融合图像.实验建立在标准的融合数据集中,并与传统和最近的融合方法进行比较.实验结果证明,该算法所获得的融合结果在方差和信息熵上具有更好的表现,该算法能够有效克服多聚焦图像融合中缺乏细节保护和结构不连续的缺点,同时有更好的视觉效果. 相似文献

10.

融合极端学习机的判别性分析字典学习算法

王军浩闫德勤刘德山邢钰佳《计算机科学》2020,47(5):137-143

研究表明,端学习机和判别性字典学习算法在图像分类领域极具有高效和准确的优势。然而,这两种方法也具有各自的缺点,极端学习机对噪声的鲁棒性较差,判别性字典学习算法在分类过程中耗时较长。为统一这种互补性以提高分类性能,文中提出了一种融合极端学习机的判别性分析字典学习模型。该模型利用迭代优化算法学习最优的判别性分析字典和极端学习机分类器。为验证所提算法的有效性,利用人脸数据集进行分类。实验结果表明,与目前较为流行的字典学习算法和极端学习机相比,所提算法在分类过程中具有更好的效果。相似文献

11.

基于原子Fisher判别准则约束字典学习算法

李争名杨南粤岑健《计算机应用》2017,37(6):1716-1721

为了提高字典的判别性能,提出基于原子Fisher判别准则约束的字典学习算法AFDDL。首先,利用特定类字典学习算法为每个原子分配一个类标,计算同类原子和不同类原子间的散度矩阵。然后,利用类内散度矩阵和类间散度矩阵的迹的差作为判别式约束项,促使不同类原子间的差异最大化,并在最小化同类原子间差异的同时减少原子间的自相关性,使得同类原子尽可能地重构某一类样本,提高字典的判别性能。在AR、FERET和LFW三个人脸数据库和USPS手写字体数据库中进行实验,实验结果表明,在四个图像数据库中,所提算法在识别率和训练时间方面均优于类标一致的K奇异值分解（LC-KSVD）算法、局部特征和类标嵌入约束的字典学习（LCLE-DL）算法、支持矢量指导的字典学习（SVGDL）算法和Fisher判别字典学习算法;且在四个数据库中,该算法也比稀疏表示分类（SRC）和协同表示分类（CRC）取得更高的识别率。相似文献

12.

基于稀疏表示全局字典学习的图像分类方法

蒲国林邱玉辉《计算机应用》2015,35(2):499-501

针对传统的稀疏表示字典学习图像分类方法在大规模分布式环境下效率低下的问题,设计一种基于稀疏表示全局字典的图像学习方法。将传统的字典学习步骤分布到并行节点上,使用凸优化方法在节点上学习局部字典并实时更新全局字典,从而提高字典学习效率和大规模数据的分类效率。最后在MapReduce平台上进行并行化实验,结果显示该方法在不影响分类精度的情况下对大规模分布式数据的分类有明显的加速,可以更高效地运用于各种大规模图像分类任务中。相似文献

13.

基于稀疏表示的医学图像融合

邱红梅李华锋余正涛《传感器与微系统》2017,36(10)

针对传统基于K阶奇异值分解(KSVD)的字典学习算法时间复杂度高,学习字典对源图像的表达能力不理想,应用于医学图像融合效果差的问题,提出了一种新的字典学习方法:在字典学习之前对医学图像的特征信息进行筛选,选取能量和细节信息丰富的图像块作为训练集学习字典;根据学习得到的字典建立源图像的稀疏表示模型,运用正交匹配追踪算法(OMP)求解每个图像块的稀疏系数,采用"绝对值最大"策略构造融合图像的稀疏表示系数,最终得到融合图像.实验结果表明:针对不同的医学图像,提出的方法有效. 相似文献

14.

Learning a hierarchical image manifold for Web image classification

Rong ZHU Min YAO? Li-hua YE Jun-ying XUAN 《浙江大学学报:C卷英文版》2012,(10):719-735

Image classification is an essential task in content-based image retrieval.However,due to the semantic gap between low-level visual features and high-level semantic concepts,and the diversification of Web images,the performance of traditional classification approaches is far from users’ expectations.In an attempt to reduce the semantic gap and satisfy the urgent requirements for dimensionality reduction,high-quality retrieval results,and batch-based processing,we propose a hierarchical image manifold with novel distance measures for calculation.Assuming that the images in an image set describe the same or similar object but have various scenes,we formulate two kinds of manifolds,object manifold and scene manifold,at different levels of semantic granularity.Object manifold is developed for object-level classification using an algorithm named extended locally linear embedding(ELLE) based on intra-and inter-object difference measures.Scene manifold is built for scene-level classification using an algorithm named locally linear submanifold extraction(LLSE) by combining linear perturbation and region growing.Experimental results show that our method is effective in improving the performance of classifying Web images. 相似文献

15.

一种基于直推判别字典学习的零样本分类方法

冀中孙涛于云龙《软件学报》2017,28(11):2961-2970

零样本分类的目标是对训练阶段未出现过的类别的样本进行识别和分类,其主要思路是,借助类别语义信息,将可见类别的知识转移到未见类别中.提出了一种直推式的字典学习方法,包含以下两个步骤：首先,提出一个判别字典学习模型,对带标签的可见类别样本的视觉特征和类别语义特征建立映射关系模型;然后,针对可见类别和未见类别不同引起的域偏移问题,提出了一个基于直推学习的修正模型.通过在3个基准数据集（AwA,CUB和SUN）上的实验结果,证明了该方法的有效性和先进性. 相似文献

16.

Multi-polarimetric SAR image compression based on sparse representation

CHEN Yuan ZHANG Rong&YIN Dong 《中国科学:信息科学(英文版)》2012,(8):1888-1897

The use of sparse representation in signal and image processing has gradually increased over the past few years.Obtaining an over-complete dictionary from a set of signals allows us to represent these signals as a sparse linear combination of dictionary atoms.By considering the relativity among the multi-polarimetric synthetic aperture radar(SAR)images,a new compression scheme for multi-polarimetric SAR image based sparse representation is proposed.The multilevel dictionary is learned iteratively in the 9/7 wavelet domain using a single channel SAR image,and the other channels are compressed by sparse approximation,also in the 9/7 wavelet domain,followed by entropy coding of the sparse coefficients.The experimental results are compared with two state-of-the-art compression methods:SPIHT(set partitioning in hierarchical trees)and JPEG2000.Because of the efficiency of the coding scheme,our method outperforms both SPIHT and JPEG2000 in terms of peak signal-to-noise ratio(PSNR)and edge preservation index(EPI). 相似文献

17.

Multi-polarimetric SAR image compression based on sparse representation

CHEN Yuan ZHANG Rong YIN Dong 《中国科学:信息科学(英文版)》2012,(8):1888-1897

相似文献

18.

基于稀疏表示与线性回归的图像快速超分辨率重建

下载免费PDF全文

赵志辉赵瑞珍岑翼刚张凤珍《智能系统学报》2017,12(1):8-14

单幅图像超分辨率的目的是从一幅低分辨率的图像来重构出高分辨率的图像。基于稀疏表示和邻域嵌入的超分辨率图像重建方法使得重建图像质量有了极大的改善。但这些方法还很难应用到实际中,因为其重建图像的速度太慢或者需要调节复杂的参数。目前大多数的方法在图像重建的速度和质量两个方面很难有一个好的权衡。鉴于以上问题提出了一种基于线性回归的快速图像超分辨率重建算法,将稀疏表示和回归的方法有效地结合在一起。通过稀疏表示训练的字典,用一种新的方式将整个数据集划分为多个子空间,然后在每一类子空间中独立地学习高低分辨率图像之间的映射关系,最后通过选择相应的投影矩阵来重建出高分辨图像。实验结果表明,相比于其他方法,本文提出的算法无论在图像重建速度还是重建质量方面都取得了更好的超分辨率重建效果。相似文献

19.

基于Fisher字典学习稀疏表示的高光谱图像分类

袁宗泽孙浩计科峰邹焕新《遥感技术与应用》2014,29(4):646-652

近年基于稀疏表示的分类框架(Sparse Representation based Classification,SRC)在计算机视觉和模式识别领域取得了巨大成功,高光谱图像解译也逐渐引入稀疏表示方法。针对基于SRC的高光谱图像分类算法随机抽取训练样本构成字典较难捕获相似类别的相对差异性信息问题,提出采用Fisher字典学习方法增强相似类训练样本的可区分性。此外,考虑到高光谱图像具有较强空间相关性的特点,设计一种简单有效的投票策略进行类别判决。大量实验表明:基于Fisher字典学习的联合投票分类方法能够较好地改善高光谱分类精度。相似文献

20.

基于分组字典与变分模型的图像去噪算法 总被引：1，自引：0，他引：1

陶永鹏景雨顼聪《计算机应用》2019,39(2):551-555

针对加性高斯噪声去除问题，在现有传统的K均值奇异值分解（K-SVD）字典学习算法的基础上，提出一种将字典学习与变分模型相融合的改进算法。首先，根据图像的几何和光度信息将图像进行聚类分组，再将图像组按照边缘和纹理类别进行分类，根据噪声水平和图像组类别训练一个自适应字典；其次，将通过所学字典得到的稀疏表示先验与图像本身的非局部相似先验进行融合来构建变分模型；最后，通过求解变分模型得到去噪后图像。实验结果表明，与同类去噪算法相比，当噪声比率较高时，所提算法可以解决前期算法准确性较差、纹理丢失较为严重、产生视觉伪影等问题，在视觉效果上要更为理想；同时该算法结构相似性指数有明显提高，峰值信噪比（PSNR）的值更是平均提高了10%以上。相似文献