首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
随着世界上西夏学研究的兴起,西夏文献作为西夏文物的重要组成部分越来越受到重视。本文介绍了西夏古籍文献的研究意义、图像处理、分割以及分类等问题。对比分析了西夏文字图像预处理的方法,设计实现了西夏文字图像版面的分割的算法,并分析了采用模版匹配的方式对分割后图像按一定特征分类的算法。分割后的西夏文字更易于辨认研究,且有利于计算机自动进行识别和理解图像,对西夏学的研究有着重要的意义。  相似文献   

2.
西夏文字特征提取的研究   总被引:2,自引:0,他引:2  
字符的识别研究已取得了许多研究成果。西夏字的识别研究尚属一个待开发的新领域。西夏字识别的主要问题有:它属于表意文字,还是一个大字符集,具有极高的相似度(有许多结构相似的西夏字在西夏字符集中)。西夏文字的特征提取是整个西夏文字识别系统中最重要的一部分。该文针对西夏文字的特点,提出了能充分反映西夏文字特点的几种特征并加以提取;用这些特征可以有效地识别西夏字。  相似文献   

3.
西夏文字识别中的图像预处理   总被引:5,自引:0,他引:5  
西夏文字的预处理是其识别过程的第一步,它的好坏直接影响西夏文字识别的效果。文章用图像分析及处理技术研究西夏文字的预处理,就西夏文字识别预处理中的每个过程进行了详细的研究,提出的方法和处理技术在实验中收到了良好效果。  相似文献   

4.
基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。在汉字、英文等文字的版面分析已有一些研究成果,古籍的版面分析也是一个研究热点。该文就西夏文的版面分析进行了系统的研究和实践。  相似文献   

5.
基于二值化聚类的图像文字提取算法   总被引:2,自引:0,他引:2  
戴维  张申生 《计算机应用》2009,29(1):57-59,7
为解决渐变色给文字提取聚类算法带来的问题,研究与实现了基于二值化聚类的图像文字提取算法。图像通过一系列预处理后,得到了利于聚类的二值图像,根据背景图像区域特征,对图像进行聚类分块,再利用文字图像区域特征,聚类识别出文字区域。实验表明,该算法在各类图像上取得了理想的效果。  相似文献   

6.
针对文本图像中的文字难以提取分割的问题,文章提出了一种基于连通域的算法。算法通过连通域阀值分析,将文本块联通,继而将文字成功分割。实验结果表明本算法能快速准确地分割文字。  相似文献   

7.
传统的少数民族文字缺乏利用数字图像处理技术进行分析的研究,水族古文字依靠口传、纸张手抄、刺绣、碑刻、木刻和古籍等传承,文字清晰度不足,数字化读取困难,无法满足信息化时代对濒危水族文字抢救提出的新要求.文中提出一种基于自适应图像增强及区域检测的水族文字提取与分割算法,通过对数变换和伽玛变换处理复杂环境下图像的光照影响,利...  相似文献   

8.
一种身份证图像自动识别中文字定位与分割的方法   总被引:4,自引:1,他引:4  
针对扫描后的身份证图像存在纹理及背景等强烈干扰,详细探讨了利用数字图像处理技术对身份证上的文字信息进行定位与分割的一种方法。该方法通过对身份证的特征的研究,利用水平投影与垂直投影相结合的方法,首先确定出文字的大致区域,然后利用模板框准确的定位出文字的位置。实例表明所提出的方法行之有效。  相似文献   

9.
基于ADO技术的JPEG图像数据库设计与实现   总被引:1,自引:0,他引:1  
本文基于ADO技术建立了一个JPEG图像数据库。首先把输入的BMP图像压缩成JPEG格式,再运用Delphi 中的TJPEGImage类和ADO存取技术,实现了图像数据库对JPEG格式图像的支持。  相似文献   

10.
随着国内外对西夏学研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献数字化、文本化则有着极其重要的意义。该文采用弹性网格方法及线性判别分析(Linear Discriminant Analysis,LDA)方法对西夏文字识别进行了研究。首先对西夏影印文献进行预处理、细化,然后根据西夏文字笔画分布构造非均匀的弹性网格,将弹性网格分别作用于西夏文字的四个方向分量上,统计像素点在网格内的概率分布作为特征,最后使用LDA方法对提取的特征降维处理。对240类共9 600个西夏文字做4重交叉验证,平均识别率可达87.99%,实验表明该方法是有效的。  相似文献   

11.
12.
为解决传统机器学习方法特征提取工作艰难导致对跨站脚本检测性能有限的问题,提出应用注意力机制改进编码-解码框架的方法并以此建立模型检测跨站脚本。由卷积神经网络和双向门控循环单元网络并行构成编码器,既考虑输入数据上下文信息,又充分提取有效特征;使用注意力机制解决传统编码-解码框架的“分心问题”;使用门控循环单元网络构成解码器,使用分类器进行分类检测。在收集到的数据集上进行仿真实验,验证了模型的有效性和性能优势。  相似文献   

13.
W. F. Clocksin 《Software》1985,15(7):669-675
All clauses comprising a Prolog program are stored in a database from which they can be removed later. Other long-term data structures are represented as clauses and are also stored and removed from the same database. Implementation techniques for the manipulation of clauses are not well known, and a lack of information has led to incorrect and incomplete implementations. Further previously unresolved issues are apparent when considering the storage of compiled clauses. We describe the way database manipulations are performed in Prolog-X, a new compiler-based Prolog system. We also introduce a new technique for storing the source form of compiled clauses.  相似文献   

14.
针对隐马尔科夫模型(HMM)在跨站脚本检测中对初始先验假设估计不准确和以极大似然准则规定的HMM参数分类能力差的缺陷,提出了一种基于MLP-HMM的跨站脚本检测模型。首先,使用自然语言处理(NLP)方法解决数据高维复杂性问题。然后,通过多层感知机(MLP)神经网络学习对整个模型进行权值微调得到初始观察矩阵。最后,将该观察矩阵代入HMM中,增强HMM参数构建能力和分类能力。结果表明,结合MLP的HMM相比于原始HMM以及传统算法在跨站脚本检测上检测率有显著提高,并缩短了检测时间。  相似文献   

15.
研究了自动化测试脚本及基于构件的软件复用技术,提出一个测试脚本构件模型TSCM。该模型结合测试脚本特性,在借鉴现行软件构件模型基础上加入构件连接子增强测试脚本构件的独立性和可复用性。设计了TSCM模型的XML框架,实现了测试脚本构件自动生成、验证及不同测试语言之间的自动转换。  相似文献   

16.
针对安全苛求系统(SCS)自动化测试中测试脚本规模大、结构复杂、难维护的特点,提出一种基于XML的测试脚本自动生成方法。将XML作为测试脚本语言,使用SED模式设计SCS测试场景,采用FSM对SCS运营场景建模,设计一系列转换生成算法自动生成XML测试脚本,实现了SCS测试脚本自动化生成和验证,并成功应用到高速铁路CTCS-2级列车运行控制系统仿真测试中。  相似文献   

17.
介绍了西北地区迟发、漏发气象报文的监控现状,指出迟发、漏发情况对西北地区民航气象工作的影响,并提出解决方案。设计并实现了基于Shell脚本的气象报文迟发漏发监控程序。该程序通过对各个分局和航站的报文发送时间进行提取和显示,可实现对气象报文发送情况的跟踪监控,可达到严查迟发、漏发气象报文的目的,以提高西北民航气象发报准确率。  相似文献   

18.
为了能够对文档中的少数民族文字种类进行正确地识别分类,提出一种基于小波分析与改进的二次分类函数(MQDF)的少数民族文字种类识别方法.该方法采用多辨识小波分解,从而获得小波能量和小波能量比例分布的特征描述,利用MQDF分类器对少数民族文种进行识别.构建藏文、西双版纳傣文、纳西象形文、维吾尔文、德宏傣文和彝文6种常用的少数民族文字及汉字、英语共8种文字的样本库,采用该方法对少数民族的样本库进行了进行训练和测试.实验结果显示,该方法在多层小波分解的情况下,对于少数民族文种识别的精度好于传统的贝叶斯和KNN.  相似文献   

19.
基于Hibernate实现对异构数据库的集成   总被引:2,自引:0,他引:2  
利用面向对象的hibernate数据访问技术,不但可以利用动态的数据库配置来实现不同物理位置的数据的透明访问,本文通过分析数据集成中数据主题域的划分,建立一套与物理数据结构隔离的数据对象,在此基础上利用类的反射机制的实现算法定义了一套统一的数据访问接口,消除了数据集成中对物理数据结构的依赖。  相似文献   

20.
Because of its complexity, handwriting recognition has to exploit many sources of information to be successful, e.g. the handwriting zones. Variability of zone-lines, however, requires a more flexible representation than traditional horizontal or linear methods. The proposed method therefore employs approximating cubic splines. Using entire lines of text rather than individual words is shown to improve the zoning accuracy, especially for short words. The new method represents an improvement over existing methods in terms of range of applicability, zone-line precision and zoning-classification accuracy. Application to several problems of handwriting recognition is demonstrated and evaluated.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号