共查询到20条相似文献,搜索用时 140 毫秒
1.
传统的少数民族文字缺乏利用数字图像处理技术进行分析的研究,水族古文字依靠口传、纸张手抄、刺绣、碑刻、木刻和古籍等传承,文字清晰度不足,数字化读取困难,无法满足信息化时代对濒危水族文字抢救提出的新要求.文中提出一种基于自适应图像增强及区域检测的水族文字提取与分割算法,通过对数变换和伽玛变换处理复杂环境下图像的光照影响,利用中值滤波降低噪声,接着采用Sobel算子提取水书灰度图像的文字边缘细节,通过阈值化、膨胀和腐蚀处理提取文字轮廓,最后通过区域检测与文字定位算法实现水族古文字的提取和分割.实验结果表明该算法能有效降低图像噪声并提取水族文字,分离的水族文字信息较完整,在一定程度上减轻了民族研究者和考古专家的工作量.该算法可以应用于水族文字识别、文物修复和保护、水族文化传承等领域,具有一定的应用前景和实用价值. 相似文献
2.
3.
针对视觉文本图像,在获取、处理、传输中产生的椒盐噪声,提出一种基于文字笔画特性消除椒盐噪声的新算法。该算法智能判断被处理像素及其邻域内的像素点是否为噪声,从而有效地把文字目标和椒盐噪声加以区分。实验结果显示,相比传统的去噪和平滑算法,该方法能准确地抑制噪声,同时避免了对文字笔画的影响,减少了对后继识别的干扰。 相似文献
4.
5.
6.
赵顺 《自动化技术与应用》2020,39(3):152-154+162
本文主要提出了以自适应流形滤波器为载体的碑刻书法图像清晰化方法,即针对基于自适应流形滤波平滑石碑图像与基于文字轮廓的石碑背景噪声去除方法做了详细阐述,通过分析结果表明,此清晰化方法的水平良好,效果突出。在此基础上,本文从系统功能模块与运行环境两方面,开发设计了基于计算机技术的碑刻书法图像清晰化系统,通过系统测试证明,清晰化效果良好,实用价值较好,值得大力推广应用。 相似文献
7.
本文提出了一种印刷体汉字计算机自动识别的方案.从EIT-PS简易图文扫描器输入一页印刷体汉字,经前处理程序切割出每一个字并将其正规化;利用网格单元特征进出该输入文字的候补文字;再计算输入文字与候补文字的复合类似度,复合类似度最高的候补文字被认为是输入文字.本识别方法具有抗噪声干扰,抗连笔、断笔等变形的能力.对任选的一万字进行识别试验的结果,取得了积累识别率98.6%的良好成绩. 相似文献
8.
为生成含噪声的扫描文档图像的基准标引信息,系统首先基于无噪声的PDF文档抽取理想化标引信息,采用透视变换模型,将其与含噪声文档图像进行配准,最终生成含噪声图像的基准标引信息,将其用于测试文字识别、检索的精度.系统还基于几种经典的图像退化模型,批量产生了含不同噪声类型的文档图像.经实验表明,该系统标引信息精度高,图像退化结果与实际噪声效果接近. 相似文献
9.
10.
基于小波变换的拓片文字边缘检测* 总被引:1,自引:0,他引:1
针对拓片得到的文字图像具有模糊细节多、效果差等特征,以及传统算法对其边缘检测的精度不高,根据拓片文字边缘独立于尺度传播的特性,提出了一种基于二进小波变换的拓片文字图像边缘提取和增强算法。首先用二进小波对拓片文字图像进行多尺度分解,再结合小波变换模值跨尺度传递的不同特性,进行多尺度下的图像边缘提取、增强和细化。实验表明,该算法克服了传统算法的不足,弱化了单尺度下噪声抑制与边缘细节提取精度之间的矛盾,从而具有更好的实用性。 相似文献
11.
Tuan Anh Tran In Seop Na Soo Hyung Kim 《International Journal on Document Analysis and Recognition》2016,19(3):191-209
Document layout analysis or page segmentation is the task of decomposing document images into many different regions such as texts, images, separators, and tables. It is still a challenging problem due to the variety of document layouts. In this paper, we propose a novel hybrid method, which includes three main stages to deal with this problem. In the first stage, the text and non-text elements are classified by using minimum homogeneity algorithm. This method is the combination of connected component analysis and multilevel homogeneity structure. Then, in the second stage, a new homogeneity structure is combined with an adaptive mathematical morphology in the text document to get a set of text regions. Besides, on the non-text document, further classification of non-text elements is applied to get separator regions, table regions, image regions, etc. The final stage, in refinement region and noise detection process, all regions both in the text document and non-text document are refined to eliminate noises and get the geometric layout of each region. The proposed method has been tested with the dataset of ICDAR2009 page segmentation competition and many other databases with different languages. The results of these tests showed that our proposed method achieves a higher accuracy compared to other methods. This proves the effectiveness and superiority of our method. 相似文献
12.
一种基于CHI值特征选取的粗糙集文本分类规则抽取方法 总被引:6,自引:1,他引:6
结合文本分类规则抽取的特点,给出了近似规则的定义。该方法首先利用CHI值进行特征选取并为下一步特征选取提供特征重要性信息,然后使用粗糙集对离散决策表继续进行特征选取,最后用粗糙集抽取出精确规则或近似规则。该方法将CHI值特征选取和粗糙集理论充分结合,避免了用粗糙集对大规模决策表进行特征约简,同时避免了决策表的离散化。该方法提高了文本规则抽取的效率,并使其更趋实用化。实验结果表明了这种方法的有效性和实用性。 相似文献
13.
自动文本分类的效果在很大程度上依赖于属性特征的选择。针对传统基于频率阈值过滤的特征选择方法会导致有效信息丢失,影响分类精度的不足,提出了一种基于粗糙集的文本自动分类算法。该方法对加权后的特征属性进行离散化,建立一个决策表;根据基于依赖度的属性重要度对决策表中条件属性进行适当的筛选;采用基于条件信息熵的启发式算法实现文本属性特征的约简。实验结果表明,该方法能约简大量冗余的特征属性,在不降低分类精度的同时,提高文本分类的运行效率。 相似文献
14.
信息过滤中基于二元近似关系分布的噪声屏蔽算法 总被引:3,自引:0,他引:3
针对信息过滤反馈中充斥噪声的缺陷,提出一种基于二元近似关系分布(distribution of two-dimension similarity,简称DTS)的过滤策略.DTS根据噪声和用户模型的相悖关系,为信息流建立二元近似关系模型.同时,根据信息在二维近似关系空间中的分布,采用基于LMS(least mean square)分类器的AdaBoost算法建立噪声和相关信息的分类曲线,从而辅助信息过滤系统识别和屏蔽反馈中的噪声.通过实验验证,该算法显著提高了过滤系统屏蔽噪声的能力. 相似文献
15.
随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点.传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响.提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果. 相似文献
16.
视频文本的自动提取方法 总被引:4,自引:0,他引:4
提出一种基于彩色边缘检测和游程平滑的视频文本提取方法,首先用彩色边缘检测算子检测出图像中的边缘。然后用多次水平和垂直的游程平滑操作使得文字边缘形成连通区域,并去掉部分孤立的噪声,再通过对连通域的分析和分解定位出文本区域的边界,最后对文本区进行确认.实验表明,本文的视频文本自动提取方法具有较高的文本提取率和较准确的边界定位。 相似文献
17.
18.
提高复杂背景及噪声干扰文本图像的文本分割性能是文本识别研究中的重要问题和难点,为更好地解决这一难题,提出一种基于超像素融合的文本分割方法。首先对文本图像初始二值化,并估计文本笔画宽度;然后进行图像超像素分割并融合;最后利用超像素融合的局部相似性对初始二值化图像进行文本校验。实验结果表明,与最大稳定极值区域(MSER)及笔画超像素聚合(SSG)方法相比,所提方法在KAIST数据集上的分割精度分别提高了8.00个百分点和7.00个百分点,在ICDAR2003数据集上的文字识别率分别提高了5.33个百分点和4.88个百分点。所提方法具有较强的去噪能力。 相似文献
19.
基于概念的文本类别特征提取与文本模糊匹配 总被引:15,自引:1,他引:15
文本信息特征提取和文本分类是当前智能信息服务系统基础研究的重点。该文给出一种新的类别特征提取与文本匹配方法。首先对术语特征权进行了综合计算,然后基于概念网络术语—概念映射关系,将特征权由术语空间转换到概念空间并做权值限幅处理。在此基础上,通过对概念进行类内和类间的统计分析,得到类别特征的均值与方差两个向量,通过模糊距离计算来对文本进行类别匹配。该文方法克服了传统IDF方法缺点,能有效地从概念上提取文本类特征,提高文本自动分类的准确性。 相似文献
20.
针对支持向量机中存在的对噪音和野值敏感的问题,提出了一种基于重复训练的支持向量机方法。该方法选取重复训练后会对分类面有影响的样本,根据其类别隶属度,重复训练相应的次数,以此来改变样本的权值,减小噪音和野值的影响。将该算法应用于文本分类中,实验结果表明,该方法在适度增加了训练时间的情况下,不仅比标准支持向量机方法具有更好的抗噪音和野值的能力,而且提高了分类性能。 相似文献