首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
传统的少数民族文字缺乏利用数字图像处理技术进行分析的研究,水族古文字依靠口传、纸张手抄、刺绣、碑刻、木刻和古籍等传承,文字清晰度不足,数字化读取困难,无法满足信息化时代对濒危水族文字抢救提出的新要求.文中提出一种基于自适应图像增强及区域检测的水族文字提取与分割算法,通过对数变换和伽玛变换处理复杂环境下图像的光照影响,利用中值滤波降低噪声,接着采用Sobel算子提取水书灰度图像的文字边缘细节,通过阈值化、膨胀和腐蚀处理提取文字轮廓,最后通过区域检测与文字定位算法实现水族古文字的提取和分割.实验结果表明该算法能有效降低图像噪声并提取水族文字,分离的水族文字信息较完整,在一定程度上减轻了民族研究者和考古专家的工作量.该算法可以应用于水族文字识别、文物修复和保护、水族文化传承等领域,具有一定的应用前景和实用价值.  相似文献   

2.
提出一个高效的从单幅二维书法图像生成三维碑刻或牌匾的算法.首先在输入书法作品图像中检测出书法文字区域,然后在这些区域计算二维欧式距离场.根据事先定义的书法文字雕刻模式(阴刻、阳刻、阴阳刻)调制距离场获得三维文字表面初始估计,对宽大牌匾字还可进一步调整距离场函数进行表面估计.接着采用高斯模糊光滑文字表面,最后叠加上背景区域高度和高频细节信息,生成三维书法碑刻或牌匾的高度图.文中的算法能够快速生成高质量的三维书法碑刻以及牌匾效果,作者用行书、隶书、草书、篆字等书法作品进行实验,效果令人满意.  相似文献   

3.
一种新的去除视觉文本图像椒盐噪声的算法   总被引:3,自引:1,他引:3       下载免费PDF全文
针对视觉文本图像,在获取、处理、传输中产生的椒盐噪声,提出一种基于文字笔画特性消除椒盐噪声的新算法。该算法智能判断被处理像素及其邻域内的像素点是否为噪声,从而有效地把文字目标和椒盐噪声加以区分。实验结果显示,相比传统的去噪和平滑算法,该方法能准确地抑制噪声,同时避免了对文字笔画的影响,减少了对后继识别的干扰。  相似文献   

4.
提出一种融合自适应图像增强的IE-AlexNet少数民族文字图像识别方法。以阿拉伯文字为例,计算各场景的图像噪声阈值,利用六种方法实现图像增强,然后构建一种改进AlexNet的神经网络模型,实现阿拉伯文字识别。实验结果表明,所提方法能有效检测复杂环境下的少数民族文字,其F1值为0.9559,准确率为0.9553,均优于其他模型。同时,对比实验突显图像增强的有效性,具有一定应用价值。  相似文献   

5.
提出了一种基于人工神经网络的含噪声文字的识别方法.以改进的人工神经网络BP算法为基础,设计了一个文字识别系统,对英文字母、数字和汉字进行识别,通过用带有噪声的文字来训练网络,提高了网络的容错能力.实验结果表明,改进的BP算法降低了网络训练次数,有效地对由数字、英文字母、汉字组成的样本集进行训练,实现了对多种字符的正确识别.  相似文献   

6.
赵顺 《自动化技术与应用》2020,39(3):152-154+162
本文主要提出了以自适应流形滤波器为载体的碑刻书法图像清晰化方法,即针对基于自适应流形滤波平滑石碑图像与基于文字轮廓的石碑背景噪声去除方法做了详细阐述,通过分析结果表明,此清晰化方法的水平良好,效果突出。在此基础上,本文从系统功能模块与运行环境两方面,开发设计了基于计算机技术的碑刻书法图像清晰化系统,通过系统测试证明,清晰化效果良好,实用价值较好,值得大力推广应用。  相似文献   

7.
本文提出了一种印刷体汉字计算机自动识别的方案.从EIT-PS简易图文扫描器输入一页印刷体汉字,经前处理程序切割出每一个字并将其正规化;利用网格单元特征进出该输入文字的候补文字;再计算输入文字与候补文字的复合类似度,复合类似度最高的候补文字被认为是输入文字.本识别方法具有抗噪声干扰,抗连笔、断笔等变形的能力.对任选的一万字进行识别试验的结果,取得了积累识别率98.6%的良好成绩.  相似文献   

8.
为生成含噪声的扫描文档图像的基准标引信息,系统首先基于无噪声的PDF文档抽取理想化标引信息,采用透视变换模型,将其与含噪声文档图像进行配准,最终生成含噪声图像的基准标引信息,将其用于测试文字识别、检索的精度.系统还基于几种经典的图像退化模型,批量产生了含不同噪声类型的文档图像.经实验表明,该系统标引信息精度高,图像退化结果与实际噪声效果接近.  相似文献   

9.
为了使联机文字书写指导系统对用户书写过程产生的指导意见客观性更强,针对不规范书写行为,将触摸书写的笔迹噪声信息分为白色、黑色和抖动三种类型。白色噪声由线性插值算法消除,黑色噪声采用阈值去重算法消除,抖动噪声则通过基于关键点求解的虚拟平滑算法消除。实验结果表明,该方法为文字书写指导系统进行实时书写分析提供了真实、有效和可信的数据环境。  相似文献   

10.
基于小波变换的拓片文字边缘检测*   总被引:1,自引:0,他引:1  
针对拓片得到的文字图像具有模糊细节多、效果差等特征,以及传统算法对其边缘检测的精度不高,根据拓片文字边缘独立于尺度传播的特性,提出了一种基于二进小波变换的拓片文字图像边缘提取和增强算法。首先用二进小波对拓片文字图像进行多尺度分解,再结合小波变换模值跨尺度传递的不同特性,进行多尺度下的图像边缘提取、增强和细化。实验表明,该算法克服了传统算法的不足,弱化了单尺度下噪声抑制与边缘细节提取精度之间的矛盾,从而具有更好的实用性。  相似文献   

11.
Document layout analysis or page segmentation is the task of decomposing document images into many different regions such as texts, images, separators, and tables. It is still a challenging problem due to the variety of document layouts. In this paper, we propose a novel hybrid method, which includes three main stages to deal with this problem. In the first stage, the text and non-text elements are classified by using minimum homogeneity algorithm. This method is the combination of connected component analysis and multilevel homogeneity structure. Then, in the second stage, a new homogeneity structure is combined with an adaptive mathematical morphology in the text document to get a set of text regions. Besides, on the non-text document, further classification of non-text elements is applied to get separator regions, table regions, image regions, etc. The final stage, in refinement region and noise detection process, all regions both in the text document and non-text document are refined to eliminate noises and get the geometric layout of each region. The proposed method has been tested with the dataset of ICDAR2009 page segmentation competition and many other databases with different languages. The results of these tests showed that our proposed method achieves a higher accuracy compared to other methods. This proves the effectiveness and superiority of our method.  相似文献   

12.
一种基于CHI值特征选取的粗糙集文本分类规则抽取方法   总被引:6,自引:1,他引:6  
王明春  王正欧  张楷  郝玺龙 《计算机应用》2005,25(5):1026-1028,1033
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。  相似文献   

13.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。  相似文献   

14.
信息过滤中基于二元近似关系分布的噪声屏蔽算法   总被引:3,自引:0,他引:3  
洪宇  张宇  郑伟  刘挺  李生 《软件学报》2008,19(11):2887-2898
针对信息过滤反馈中充斥噪声的缺陷,提出一种基于二元近似关系分布(distribution of two-dimension similarity,简称DTS)的过滤策略.DTS根据噪声和用户模型的相悖关系,为信息流建立二元近似关系模型.同时,根据信息在二维近似关系空间中的分布,采用基于LMS(least mean square)分类器的AdaBoost算法建立噪声和相关信息的分类曲线,从而辅助信息过滤系统识别和屏蔽反馈中的噪声.通过实验验证,该算法显著提高了过滤系统屏蔽噪声的能力.  相似文献   

15.
随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点.传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响.提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果.  相似文献   

16.
视频文本的自动提取方法   总被引:4,自引:0,他引:4  
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。  相似文献   

17.
18.
张矿  朱远平 《计算机应用》2016,36(12):3418-3422
提高复杂背景及噪声干扰文本图像的文本分割性能是文本识别研究中的重要问题和难点,为更好地解决这一难题,提出一种基于超像素融合的文本分割方法。首先对文本图像初始二值化,并估计文本笔画宽度;然后进行图像超像素分割并融合;最后利用超像素融合的局部相似性对初始二值化图像进行文本校验。实验结果表明,与最大稳定极值区域(MSER)及笔画超像素聚合(SSG)方法相比,所提方法在KAIST数据集上的分割精度分别提高了8.00个百分点和7.00个百分点,在ICDAR2003数据集上的文字识别率分别提高了5.33个百分点和4.88个百分点。所提方法具有较强的去噪能力。  相似文献   

19.
基于概念的文本类别特征提取与文本模糊匹配   总被引:15,自引:1,他引:15  
文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点。该文给出一种新的类别特征提取与文本匹配方法。首先对术语特征权进行了综合计算,然后基于概念网络术语—概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理。在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算来对文本进行类别匹配。该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性。  相似文献   

20.
针对支持向量机中存在的对噪音和野值敏感的问题,提出了一种基于重复训练的支持向量机方法。该方法选取重复训练后会对分类面有影响的样本,根据其类别隶属度,重复训练相应的次数,以此来改变样本的权值,减小噪音和野值的影响。将该算法应用于文本分类中,实验结果表明,该方法在适度增加了训练时间的情况下,不仅比标准支持向量机方法具有更好的抗噪音和野值的能力,而且提高了分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号