共查询到20条相似文献,搜索用时 93 毫秒
1.
随着世界上西夏学研究的兴起,西夏文献作为西夏文物的重要组成部分越来越受到重视。本文介绍了西夏古籍文献的研究意义、图像处理、分割以及分类等问题。对比分析了西夏文字图像预处理的方法,设计实现了西夏文字图像版面的分割的算法,并分析了采用模版匹配的方式对分割后图像按一定特征分类的算法。分割后的西夏文字更易于辨认研究,且有利于计算机自动进行识别和理解图像,对西夏学的研究有着重要的意义。 相似文献
2.
西夏文字特征提取的研究 总被引:2,自引:0,他引:2
字符的识别研究已取得了许多研究成果。西夏字的识别研究尚属一个待开发的新领域。西夏字识别的主要问题有:它属于表意文字,还是一个大字符集,具有极高的相似度(有许多结构相似的西夏字在西夏字符集中)。西夏文字的特征提取是整个西夏文字识别系统中最重要的一部分。该文针对西夏文字的特点,提出了能充分反映西夏文字特点的几种特征并加以提取;用这些特征可以有效地识别西夏字。 相似文献
3.
西夏文字识别中的图像预处理 总被引:5,自引:0,他引:5
西夏文字的预处理是其识别过程的第一步,它的好坏直接影响西夏文字识别的效果。文章用图像分析及处理技术研究西夏文字的预处理,就西夏文字识别预处理中的每个过程进行了详细的研究,提出的方法和处理技术在实验中收到了良好效果。 相似文献
4.
基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。在汉字、英文等文字的版面分析已有一些研究成果,古籍的版面分析也是一个研究热点。该文就西夏文的版面分析进行了系统的研究和实践。 相似文献
5.
基于二值化聚类的图像文字提取算法 总被引:2,自引:0,他引:2
为解决渐变色给文字提取聚类算法带来的问题,研究与实现了基于二值化聚类的图像文字提取算法。图像通过一系列预处理后,得到了利于聚类的二值图像,根据背景图像区域特征,对图像进行聚类分块,再利用文字图像区域特征,聚类识别出文字区域。实验表明,该算法在各类图像上取得了理想的效果。 相似文献
6.
针对文本图像中的文字难以提取分割的问题,文章提出了一种基于连通域的算法。算法通过连通域阀值分析,将文本块联通,继而将文字成功分割。实验结果表明本算法能快速准确地分割文字。 相似文献
7.
8.
9.
基于ADO技术的JPEG图像数据库设计与实现 总被引:1,自引:0,他引:1
本文基于ADO技术建立了一个JPEG图像数据库。首先把输入的BMP图像压缩成JPEG格式,再运用Delphi 中的TJPEGImage类和ADO存取技术,实现了图像数据库对JPEG格式图像的支持。 相似文献
10.
随着国内外对西夏学研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献数字化、文本化则有着极其重要的意义。该文采用弹性网格方法及线性判别分析(Linear Discriminant Analysis,LDA)方法对西夏文字识别进行了研究。首先对西夏影印文献进行预处理、细化,然后根据西夏文字笔画分布构造非均匀的弹性网格,将弹性网格分别作用于西夏文字的四个方向分量上,统计像素点在网格内的概率分布作为特征,最后使用LDA方法对提取的特征降维处理。对240类共9 600个西夏文字做4重交叉验证,平均识别率可达87.99%,实验表明该方法是有效的。 相似文献
11.
12.
为解决传统机器学习方法特征提取工作艰难导致对跨站脚本检测性能有限的问题,提出应用注意力机制改进编码-解码框架的方法并以此建立模型检测跨站脚本。由卷积神经网络和双向门控循环单元网络并行构成编码器,既考虑输入数据上下文信息,又充分提取有效特征;使用注意力机制解决传统编码-解码框架的“分心问题”;使用门控循环单元网络构成解码器,使用分类器进行分类检测。在收集到的数据集上进行仿真实验,验证了模型的有效性和性能优势。 相似文献
13.
W. F. Clocksin 《Software》1985,15(7):669-675
All clauses comprising a Prolog program are stored in a database from which they can be removed later. Other long-term data structures are represented as clauses and are also stored and removed from the same database. Implementation techniques for the manipulation of clauses are not well known, and a lack of information has led to incorrect and incomplete implementations. Further previously unresolved issues are apparent when considering the storage of compiled clauses. We describe the way database manipulations are performed in Prolog-X, a new compiler-based Prolog system. We also introduce a new technique for storing the source form of compiled clauses. 相似文献
14.
针对隐马尔科夫模型(HMM)在跨站脚本检测中对初始先验假设估计不准确和以极大似然准则规定的HMM参数分类能力差的缺陷,提出了一种基于MLP-HMM的跨站脚本检测模型。首先,使用自然语言处理(NLP)方法解决数据高维复杂性问题。然后,通过多层感知机(MLP)神经网络学习对整个模型进行权值微调得到初始观察矩阵。最后,将该观察矩阵代入HMM中,增强HMM参数构建能力和分类能力。结果表明,结合MLP的HMM相比于原始HMM以及传统算法在跨站脚本检测上检测率有显著提高,并缩短了检测时间。 相似文献
15.
16.
17.
18.
为了能够对文档中的少数民族文字种类进行正确地识别分类,提出一种基于小波分析与改进的二次分类函数(MQDF)的少数民族文字种类识别方法.该方法采用多辨识小波分解,从而获得小波能量和小波能量比例分布的特征描述,利用MQDF分类器对少数民族文种进行识别.构建藏文、西双版纳傣文、纳西象形文、维吾尔文、德宏傣文和彝文6种常用的少数民族文字及汉字、英语共8种文字的样本库,采用该方法对少数民族的样本库进行了进行训练和测试.实验结果显示,该方法在多层小波分解的情况下,对于少数民族文种识别的精度好于传统的贝叶斯和KNN. 相似文献
19.
基于Hibernate实现对异构数据库的集成 总被引:2,自引:0,他引:2
利用面向对象的hibernate数据访问技术,不但可以利用动态的数据库配置来实现不同物理位置的数据的透明访问,本文通过分析数据集成中数据主题域的划分,建立一套与物理数据结构隔离的数据对象,在此基础上利用类的反射机制的实现算法定义了一套统一的数据访问接口,消除了数据集成中对物理数据结构的依赖。 相似文献
20.
A. HennigN. Sherkat 《Pattern recognition》2002,35(2):445-454
Because of its complexity, handwriting recognition has to exploit many sources of information to be successful, e.g. the handwriting zones. Variability of zone-lines, however, requires a more flexible representation than traditional horizontal or linear methods. The proposed method therefore employs approximating cubic splines. Using entire lines of text rather than individual words is shown to improve the zoning accuracy, especially for short words. The new method represents an improvement over existing methods in terms of range of applicability, zone-line precision and zoning-classification accuracy. Application to several problems of handwriting recognition is demonstrated and evaluated. 相似文献