首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
藏文识别的预处理   总被引:9,自引:2,他引:7  
预处理是整个文字识别系统的重要组成部分,预处理性能的优劣将直接影响整个识别系统的性能,根据藏文字在字形和书写方式上的特点,实现了一种适用于藏文识别的预处理技术,整个预处理过程包括二值化、版面分析、倾斜校正、字符切和归一化,在预处理过程中还提取了一此圾关字丁的基本特征,这些特征充分反映了藏文的特点,具有良好的稳定性,可以用于识别系统的粗分类和后处理。  相似文献   

2.
藏文乌梅体场景文字识别是文字识别领域的一个难题,使用传统的文字识别方法人工构件难度很大。文章使用深度学习方法进行研究,使用卷积神经网络(Convolutional Neural Network,CNN)提取图像信息,采用注意力与循环神经网络(Recurrent Neural Network,RNN)结合的方式进行解码。实验结果证明,模型对于藏文乌梅体场景文字能够有效识别F1值达到86.76%。  相似文献   

3.
印刷体藏文文字识别技术研究   总被引:2,自引:0,他引:2       下载免费PDF全文
藏文字因其结构的特殊性,在应用传统文字识别方法进行识别时正确识别率较低,识别效果较差。在深入分析以印刷体藏文文字特征的基础上,提出了一系列可以在干扰情况下提高识别率的方法,包括局部自适应二值化算法、基于连通域的切分、基于网格的模糊笔划特征提取等。实验结果说明,这些方法可提高印刷体藏文文字识别系统的正确识别率和抗干扰能力。  相似文献   

4.
多字体印刷藏文字符识别   总被引:5,自引:1,他引:5  
藏文字符识别系统是中文多文种信息处理系统的重要组成部分,但至今国内外的研究基本处于空白。本文提出了一种基于统计模式识别的多字体印刷藏文字符识别方法:从字符轮廓中抽取方向线素特征,利用线性鉴别分析(LDA)压缩降维后得到紧凑的字符特征向量。采用基于置信度分析的两级分类策略,设计了带偏差欧氏距离分类器(EDD)完成高效的粗分类,细分类采用修正二次鉴别函数(MQDF)。通过实验选取恰当的分类器参数后,在容量为177,600字符(300样本/字符类)的测试集上的识别率达到99.79%,证明了该方法的有效性。  相似文献   

5.
印刷体现代藏文识别研究   总被引:7,自引:0,他引:7  
王维兰  丁晓青  陈力  王华 《计算机工程》2003,29(3):37-38,94
以印刷体现代藏文白体、黑体、圆体、长体、竹体为字体样张,通过预处理、文本行字切分、特征选择和分类识别的初步研究,获得对5种字体文本的平均识别率为89.582%,对其他字体的文本平均识别率为93.867%。  相似文献   

6.
藏文文本编码识别方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
讨论了藏文编码识别与转换中的关键问题,介绍了藏文结构特点和统计学特征以及各种可能的识别准则,并进行分析比较。确定了使用以藏文的音节点间距规律和高频音节为特征的识别方法对方正Windows、方正Dos、同元、华光Windows、华光Dos、班智达、ASCII的藏文编码方案、ISO/IEC10646基本集、国家标准扩充集A的藏文编码识别,能够正确地将藏文文本与其他语言进行区分。在对目标样本的测试中,该算法的识别率可达100%。  相似文献   

7.
一种多字体印刷藏文字符识别方法   总被引:4,自引:0,他引:4  
王华  丁晓青 《计算机工程》2004,30(13):18-20
提出了一种完整的多字体印刷藏文字符识别方法:先提取输入字符的方向线素特征组成特征向量,然后采用两级分类策略判定字符类别。该方法在训练集和测试集上的识别率分别达到99.73%和99.44%,证明了其有效性。  相似文献   

8.
藏文地名识别是藏文命名实体识别中必须要解决的问题。通过分析藏文地名的特点及识别难点,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别,通过实验,验证了6种特征对藏文地名识别的有效性。实验结果表明该方法对藏文地名识别的准确率、召回率和[F]值分别达到了96.12%、81.92%和88.45%,实验结果与已有的系统相比,取得了较好的效果。  相似文献   

9.
目前多种藏文编码方案的同时存在,为藏文文本的检索带来了困难。因此,藏文编码的自动识别成为进行藏文文本处理首先要解决的一个基本问题。结合藏文结构特点和统计学特征,文章提出了一种基于高频字丁和音节点区位码的藏文文本编码判定算法。经测试证实,该算法在藏文文本编码的判定中具有很高的准确度。  相似文献   

10.
在分析现有藏文自动分词方法的基础上,针对藏文分词系统中虚词识别的难点进行深入研究。根据传统藏文文法,描述了藏文虚词在文本中不同的表现形式,用规则和统计相结合的方法,建立了较为全面的虚词知识库和规则库,并给出切分用虚词分块算法,该方法在不同领域的3 200个较典型的藏文句子进行了测试,结果表明,该方法的虚词识别率高达98%以上。  相似文献   

11.
通过对藏语存在句的分析和研究,实现藏语存在句的识别。借助产生式的正向推理作为藏语存在句识别的知识表示方式,并用产生式规则搜索和匹配。从人工角度构建的一种基于产生式规则的藏语存在句的识别系统,以利藏语存在句的识别。该研究为实现藏语存在句的识别提供了基础。  相似文献   

12.
提出了一种新的多层联系子层递归神经网络(MCLRNN)模型并融合藏文字丁的空间结构特征来进行联机手写藏文识别。改进后的网络结构具有多层联系子层来保留若干时刻的网络内部状态,从而可以更好地表征藏文字的各笔划特征以及笔划间的空间结构关系,同时,采用更适用于模式分类的交叉熵准则和改进的梯度下降算法来训练网络,加快了网络的收敛速度并增强其分类能力。仿真实验取得了令人满意的结果。  相似文献   

13.
藏语声纹识别技术的研究刚刚起步,建设一个用于藏语声纹识别的语料库迫在眉睫。结合藏语特点,设计、建立了一个面向藏语声纹识别的语料库。语料库包含文本相关、文本无关两部分,文本语料来自新闻报刊、文学类、教育类、科技类、佛学类、历史类和传统文化五明类等文献资料,录音者由来自多个不同藏语方言地区的50人组成,产生了语音语料9 500条,为藏语的声纹识别研究奠定了一定的基础。  相似文献   

14.
基于改进主动形状模型的人脸表情识别   总被引:3,自引:0,他引:3       下载免费PDF全文
主动形状模型(ASM)是面部特征定位、人脸识别和表情识别等模式识别领域中常用的一种方法。但受到初始情况、光照等诸多因素的影响,其性能会有所下降。研究了一种改进的主动形状模型,改进主要体现在两个方面:第一,首先用点轮廓检测算法(PCDM)检测到双眼的位置,为ASM中的点分布模型粗略地定位好初始位置;第二,从ASM原始的思想出发,充分挖掘标定点之间的联系,提出一种构建局部纹理模型的新方法。在JAFFE人脸数据库中进行验证,结果表明,改进ASM方法提高了搜索速度与特征点定位的精度。最终构造神经网络分类器进行人脸表情识别实验,得到了较好的识别率。  相似文献   

15.
基于支持向量机和小波分析的说话人识别   总被引:2,自引:0,他引:2  
为解决说话人识别问题,提出了一种基于支持向量机和小波分析的识别方法以及其框架模型,即将小波分析应用于信号预处理,并以此为基础,利用其奇异点检测原理将语音信号和噪声分离,实现语音增强,最终基于样本进行训练和测试,采用SVM实现说话人的分类识别.  相似文献   

16.
提出了基于蚁群聚类算法的雷达辐射源识别方法。该方法采用雷达辐射源特征参数建立模型,对雷达辐射源样本进行识别,仿真结果接近90%。实验表明,蚁群聚类算法识别雷达辐射源的方法具有一定的可行性。  相似文献   

17.
18.
基于条件随机场模型在字粒度上识别并切分藏文人名,其优势是可以较好地利用藏文人名在文本中出现的基本特征和上下文特征来确定藏文人名在文本序列中的边界。根据藏文人名自身的特点设定特征标签集,利用条件随机场模型作为标注建模工具来进行训练和测试。从实验结果来看,该方法有较高的识别正确率,具有进一步研究的价值。下一步的改进需要扩充训练语料,并针对人名与一般词语同形现象进行特征标签集的优化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号