期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘晓翔张树生王飞周坚冯奂《中国图象图形学报》2003,8(Z1):657-661

谱线的检测和删除是光学乐谱识别中一个重要和关键的环节,是下一步进行音符分割和识别的前提.针对直接投影方法无法检测倾斜谱线这一不足,提出一种计算若干区域水平投影队列间的交叉相关性的方法来矫正倾斜图象,然后通过投影峰值检测谱线.该方法的优点是具有较高的执行效率,且能够在一定程度上"拉直"谱线的局部弯曲和变形缺陷.在删除谱线时,提出基于游程邻接图段分析的删除方法,充分利用了谱线段的整体和宏观特征,避免了传统方法的"误删"现象发生,较好的保持了音符的完整性.实验结果表明了上述方法的正确性和有效性. 相似文献

2.

基于局部二进制模式的乐谱谱线检测与删除

《计算机科学与探索》2017,(12):2015-2022

谱线检测与删除是光学乐谱识别中重要和关键的环节之一。在乐谱中,谱线往往与大多数符号交叉或重叠,即存在像素属于谱线像素同时也属于符号像素的情况,因此删除谱线并且不破坏音乐符号并非易事。研究目标是需要删除仅仅属于谱线的像素,观察乐谱图像可以发现谱线像素与非谱线像素局部纹理存在差异,主要表现为谱线像素的局部纹理与谱线宽度相关,简洁明了,而非谱线像素的局部纹理除了存在仅与自己本身相关的情况,还存在与交叉点相关的情况。因此,采用局部二进制模式通过提取局部纹理特征,获得谱线像素与非谱线像素局部纹理的差异,对谱线与非谱线像素进行检测分类,进而将谱线像素删除。该方法不仅可以删除理想状态下乐谱谱线,对弯曲状态下乐谱谱线同样适用。实验结果证明了该方法在像素误差、片段误差等性能指标上优于现有常用方法。相似文献

3.

一种基于线阵CCD的汽车底盘图像矫正算法

郭峰吴贵芳杨莉《现代计算机》2014,(3):27-30

线阵CCD以固定行频采集汽车底盘图像时，图像会被不同程度地拉伸或压缩，为了减小变形图像与标准数据库中图像之间的差异，提出一种图像矫正算法。获取两幅图像的水平投影曲线，并计算两条曲线上的极值点，以极值点为参考点将两幅图像分割成数目相同的子块，对子块图进行双线性插值处理，从而实现图像变形矫正的目的。该算法在10种不同车型的100幅汽车底盘图像上进行实验，以算法矫正结果图与标准汽车底盘图的差值作为评价标准，结果表明该算法是有效的。相似文献

4.

单灰度图像中眼睛定位的人脸位置矫正算法 总被引：4，自引：0，他引：4

曹文明蔡魏伟王守觉《通讯和计算机》2004,1(1):28-32

人脸位置的矫正作为人脸检测定位的一个环节，在计算机人脸识别中具有重要的意义。本文提出了一种基于单人脸灰度图像中眼睛定位的人脸位置矫正方法，用居中度使图像小块居中，用匹配度求取适些小图像块中的两块眼睛的小块，再在小范围内对鼻子、嘴巴部分进行水平灰度投影，然后进行扶正。实验结果表明，该方法对于双眼可见单人脸灰度图像能实现快速有效矫正，并能在矫正结果中精确给出双眼瞳孔位置。相似文献

5.

基于纹理分析和垂直投影的车牌定位算法 总被引：9，自引：0，他引：9

应宏微姚明海张永华《控制工程》2004,11(5):432-435,476

根据车牌区域字符的纹理特征和统计规律,提出了一种综合纹理分析和垂直投影的车牌定位方法。由于光照、拍摄角度会对图像产生对比度偏低、图像倾斜和变形等不良影响,利用车牌字符纹理丰富的特征寻找车牌区域可以避开了这些不良影响,并利用灰度垂直投影的统计特征进一步删除由于复杂背景而产生的伪车牌区域。实验结果表明,该方法对于背景复杂的图像,可以得到很好的定位效果,解决了复杂背景下车牌图像提取的难点问题。相似文献

6.

一种实用的标志牌文本提取算法

范勇王俊波熊杰陈念年《微计算机信息》2009,25(24)

根据对自然场景图像分割后具有标志牌和背景明显分开等特点,提出了一种基于边框删除的标志牌文本提取算法,首先在二值化图像中采用基于边缘检测和投影算法对标志牌区域进行定位,然后采用边框删除算法提取标志牌文本.大量实验结果表明该方法能够准确定位并提取非规则的标志牌文本. 相似文献

7.

乐谱图像乐符分割技术*

刘晓翔《计算机应用研究》2010,27(2):784-787

提出基于图段拓扑关系的谱线删除方法,以避免谱线过删除现象;提出双向游程编码结合使用的符干分割方法,克服了现有方法对复杂音符适应性差、分割结果不完整等缺陷;提出音符先验知识引导下的符头切割与检测算法,以解决粘连符头的切分问题;提出基于块状体分割和特征检测的符梁分割算法,设计了适用于乐谱版面的文字和线条提取算法。该方法应用在乐谱识别系统中分割乐符具有良好的性能,尤其对乐谱内容复杂、乐符排列密集等情况有较强适应能力。相似文献

8.

乐谱图像倾角快速检测方法

刘晓翔张树生王静汪鹏《计算机工程》2004,30(2):33-35

计算机光学乐谱识别技术是将传统的纸质型乐谱转化为计算机能够“读懂”的数字音乐，在计算机音乐领域中具有重要的应用价值、乐谱识别系统的输入是乐谱扫描图像，而扫描过程中出现的图像倾斜现象，会给识别过程中的谱线定位和谱段切割带来诸多困难，必须对图像作有效的倾斜校正以保证系统的性能。为此，提出了一种快速的乐谱图像倾角检测方法。该方法首先利用乐谱文档的自身结构特点，对图像进行预处理，滤除乐谱图像中不具备方向性的干扰像素，然后通过多组图像水平投影队列间的交叉相关性计算对倾角进行检测。其特点是在确保检测倾角精度的同时具有非常高的执行效率。实验结果表明这一方法是有效、实用的。相似文献

9.

面向智能手机拍摄的变形文档图像校正

周丽冯百明关煜方格《计算机工程与科学》2022,44(1):102-109

智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在... 相似文献

10.

一种类圆形图像目标分割方法的研究

余静杨保海《计算机仿真》2010,27(12)

研究工业视觉识别系统与图像处理有密切关系.针对类圆形图像背景和目标在色彩和灰度上相近难以准确分割的问题,为了提供精确图像目标,提出了一种新型的类圆形目标分割方法.采用带方向的序贯滤波和方向边缘检测,有效去除背景干扰信息;边缘检测的结果填充后进行图像投影,据此得到待分割目标的大致区域,再次滤波得到较佳的预分割结果;采用中心扫描算法,接合投影曲线完成粗分割,得到边缘曲线;最后根据边缘曲率对边缘线进行矫正,实现了类圆形目标的完整提取.通过实验表明,对灰度相近的图像能进行有效提取,避免了阈值法的局限性,提高了类圆形目标分割的完整性和精确度. 相似文献

11.

工程图纸扫描图象的线段完整识别算法 总被引：1，自引：0，他引：1

张习文欧宗瑛《计算机工程》2000,26(8):83-84,122

给出一种基于单义域邻接图的完整识别线段算法。采用单义域邻接图来描述工程图纸扫描图象的几何属性与拓扑关系。通过分析单义域几何与拓扑特征定交点域。首先选取线段域作种子线段,以交点域为连接线索,选取共线且误差最小的线段域进行种子线段生长。从而实现线段完整识别,该算法有铲地解决了在线段与线段相交及线段与圆弧（圆）相交和相切情况下如何保证图元描述完整性问题,大大提高了整体矢量化水平。相似文献

12.

基于贪婪算法的文档图像中干扰线的去除

王平张晓峰王宜怀程仁贵《计算机系统应用》2019,28(11):238-244

各种文档中经常包含有各种特殊作用的横线、手划线等,当这些文档通过扫描等数字化方式存入计算机并需要进一步识别处理成文字编码时,这些线条却成为OCR的干扰因素,降低了文档内容的识别率.为此,本文提出一种新的文档干扰线去除算法,先将文档图像二值化,二值化过程考虑了不均匀光照带来的影响;然后将前景细化为单像素,减少线条粗细造成的影响;接着通过一种改进的贪婪算法计算横、竖两个方向线段的权重,判断权重较高的线段为干扰线;最后通过与干扰线距离的大小判断图像中每个前景像素的归属,从而获得一个完整的文档恢复图.仿真实验表明,本文提出的算法能够有效去除干扰线,特别在干扰线与文字粘连的情况下,去除干扰线的同时较少地影响文档图像的质量,且具有较高的计算速度和较好的去除效果,为图像进一步OCR识别提供了良好的基础. 相似文献

13.

基于单义域邻接图的圆弧与圆识别 总被引：4，自引：0，他引：4

下载免费PDF全文

张习文欧宗瑛《中国图象图形学报》2000,5(1):70-74

工程图纸扫描输入与识别理解是ＣＡＤ推广和普及的关键步骤之一,主要解决已有大量图纸再利用问题。在工程图纸扫描图象识别研究中,圆弧识别是识别算法中的重点和难点。传统的圆弧识别多是基于线段逼近。该文提出一种基于单义域邻接图的圆弧及圆识别算法,可以直接提取圆弧,对二值图象作水平黑洲程编码,相关游程基于线宽与拓扑的一致性构成条形域,对其中多义域进行分裂得单义域（线段域和圆弧域）,单义域邻接图可较好描述图象的相似文献

14.

自适应卷积的残差修正单幅图像去雨

下载免费PDF全文

王美华何海君李超《中国图象图形学报》2020,25(12):2484-2493

目的雨天户外采集的图像常常因为雨线覆盖图像信息产生色变和模糊现象。为了提高雨天图像的质量,本文提出一种基于自适应选择卷积网络深度学习的单幅图像去雨算法。方法针对雨图中背景误判和雨痕残留问题,加入网络训练的雨线修正系数（refine factor,RF）,改进现有雨图模型,更精确地描述雨图中各像素受到雨线的影响。构建选择卷积网络（selective kernel network,SK Net）,自适应地选择不同卷积核对应维度的信息,进一步学习、融合不同卷积核的信息,提高网络的表达力,最后构建包含SK Net、refine factor net和residual net子网络的自适应卷积残差修正网络（selective kernel convolution using a residual refine factor,SKRF）,直接学习雨线图和残差修正系数（RF）,减少映射区间,减少背景误判。结果实验通过设计的SKRF网络,在公开的Rain12测试集上进行去雨实验,取得了比现有方法更高的精确度,峰值信噪比（peak signal to noise ratio,PSNR）达到34.62 dB,结构相似性（structural similarity,SSIM）达到0.970 6。表明SKRF网络对单幅图像去雨效果有明显优势。结论单幅图像去雨SKRF算法为雨图模型中的雨线图提供一个额外的修正残差系数,以降低学习映射区间,自适应选择卷积网络模型提升雨图模型的表达力和兼容性。相似文献

15.

票据图像预处理方法的研究 总被引：4，自引：0，他引：4

张丘马利庄高岩陈志华《计算机仿真》2005,22(10):208-212

在文档影像的自动处理中,去黑边和倾斜校正是影像预处理的首要环节.该文提出了变黑边模板的概念和基于区域填充的黑边去除算法.对于图像的倾斜校正,我们提出了基于方向投影的表格线检测方法,并由此实现图像的自动分类;对不含表格线的图像,文中将字符包围盒中心作为特征点,采用Hough变换的算法进行倾斜检测.另外,倾斜检测时还采用金字塔模型降低图像分辨率,进一步提高了算法速度.实验表明,该文的方法能够有效地去除图像黑边,快速准确地检测出图像的倾斜角,并具有很强的抗干扰性和应用适应性. 相似文献

16.

A music symbols recognition method using pattern matching along with integrated projection and morphological operation techniques

Sotoodeh Mahmood Tajeripour Farshad Teimori Sadegh Jorgensen Kirk 《Multimedia Tools and Applications》2018,77(13):16833-16866

Multimedia Tools and Applications - Optical Music Recognition (OMR) can be divided into three main phases: (i) staff line detection and removal. The goal of this phase is to detect and to remove... 相似文献

17.

Robot vision using a feature search strategy generated from a 3Dobject model

Kuno Y. Okamoto Y. Okada S. 《IEEE transactions on pattern analysis and machine intelligence》1991,13(10):1085-1097

A robot vision system that automatically generates an object recognition strategy from a 3D model and recognizes the object using this strategy is presented. The appearance of an object from various viewpoints is described in terms of visible 2D features such as parallel lines and ellipses. Features are then ranked according to the number of viewpoints from which they are visible. The rank and feature extraction cost of each feature are used to generate a treelike strategy graph. This graph gives an efficient feature search order when the viewpoint is unknown, starting with commonly occurring features and ending with features specific to a certain viewpoint. The system searches for features in the order indicated by the graph. After detection, the system compares a lines representation generated from the 3D model with the image features to localize the object. Perspective projection is used in the localization process to obtain the precise position and attitude of the object, whereas orthographic projection is used in the strategy generation process to allow symbolic manipulation. Experimental results are given 相似文献

18.

椒盐噪声图像的非局部平均滤波算法

许光宇蒋社想《计算机工程与科学》2017,39(6):1133-1140

针对非局部平均(NLM)方法对椒盐噪声图像滤波效果较差的问题,通过引入噪声检测结果扩展NLM方法去除图像中椒盐噪声。在噪声检测阶段,利用图像的两个极值Lmin和Lmax把图像像素点分为非噪声点和噪声点。在滤波阶段,非噪声点的灰度值保持不变。对于噪声点,如果以该噪声点为中心的自适应滤波窗口内均为噪声点,则认为该噪声点位于图像自身灰度值为Lmin或Lmax的区域内,使用两个极值的统计结果进行恢复。否则,采用改进的NLM方法滤除噪声。构造联合噪声检测模板避免噪声点对相似权计算的干扰,噪声点的恢复值由非噪声点的灰度值加权平均得到。此外,采用迭代滤波策略对高密度噪声图像噪声点进行恢复。相关去噪实验结果证实了算法去噪的有效性,不足之处是算法的时间复杂度较高。相似文献

19.

方块队及其在小矩形区域连通检测中的应用

下载免费PDF全文

葛永慧《中国图象图形学报》2001,6(10):1030-1035

连通检测是计算机数字图象处理中一个重要的基本操作,它在模式识别、图象理解、图象特征提取等方面有着广泛的用途。为了提高连通检测的效率,在传统队数据结构的基础上,提出了一种新的数据结构,称其为方块队,同时提出了运用方块队进行小矩形区域连通检测的快速算法。该算法既可以检测目标象素在小正方形区域中的连通情况,也可以检测目标象素在小长矩形区域中的连通情况,还可直接用于图象中水平线和坚直线的初步检测。与已有的连通检测算法相比,此算法有着更高的效率。相似文献

20.

Fast Perspective Views of Images Using One-Dimensional Operations

Robertson P.K. 《Computer Graphics and Applications, IEEE》1987,7(2):47-56

Generating arbitrary perspective views of images portraying 3D surfaces can involve extensive computation and data I/O time because of the problems in determining visibility, and performing hidden-point removal. Appropriate 1D transforms of an image can allow hidden-point removal and perspective projection to be performed on scan lines or columns of these transforms. Perspective view generation then reduces to a series of extremely fast 1D operations. As a result, exact perspective views of 3D surfaces of unlimited size can be generated very much more rapidly than hitherto possible, making this a feasible interactive tool in image analysis. Maximum speed is possible when entire data sets can be stored in random access memory (RAM). However, the scan-line nature of the algorithm also allows sequential processing of data stored on disk, and fast image transposition methods allow the generation of views of surfaces much larger than available memory. 相似文献