首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 937 毫秒
1.
汉字字形变化多种多样,印刷体字符具有字体差异,手写字体更是没有统一的规则,识别难度非常大,当前用于汉字识别的字形编码方法大多依据字符,无法区分笔画相近的汉字。为此设计一种新的用于汉字识别的字形编码系统,介绍了汉字字形编码的原理,并给出了字形设计方案,依据编码原则,按照汉字被拆分的部件个数对汉字字形编码方案进行设计。详细介绍了汉字输入编辑器IME的结构,通过IME实现汉字的输入。依据汉字的使用频率与分布特性,通过数理统计工具设计含有汉字活动字库的操作系统,主要包括CC-DOS和MPC-DOS操作系统。实验结果表明,采用所设计系统对汉字进行识别精度较高且编码时间少、能耗低。  相似文献   

2.
从汉字分类思维的角度,在充分利用汉字的二雏象形性以及人眼视觉冗余特性的基础上,提出一种基于矢量汉字库的文本信息隐藏检测算法。该算法通过修改汉字字库的矢量数据来建立一个供发送方和接收方共同持有的小字库来实现信息隐藏,增加了文档内容编码冗余,提高了水印信道容量,增强了水印的隐蔽性。经实验证明该算法兼具格式水印隐蔽性和语义水印鲁棒性的双重优点,并具有嵌入空间大的特点。  相似文献   

3.
基于矢量字库的文本信息隐藏算法研究   总被引:1,自引:0,他引:1  
从汉字分类思维的角度,在充分利用汉字的二维象形性以及人眼视觉冗余特性的基础上,提出一种基于矢量汉字库的文本信息隐藏检测算法.该算法通过修改汉字字库的矢量数据来建立一个供发送方和接收方共同持有的小字库来实现信息隐藏,增加了文档内容编码冗余,提高了水印信道容量,增强了水印的隐蔽性.经实验证明该算法兼具格式水印隐蔽性和语义水印鲁棒性的双重优点,并具有嵌入空间大的特点.  相似文献   

4.
陈莹  陈巧媛 《电子与信息学报》2020,42(12):3037-3044
为减轻行人图片中的背景干扰,使网络着重于行人前景并且提高前景中人体部位的利用率,该文提出引入语义部位约束(SPC)的行人再识别网络。在训练阶段,首先将行人图片同时输入主干网络和语义部位分割网络,分别得到行人特征图和部位分割图;然后,将部位分割图与行人特征图融合,得到语义部位特征;接着,对行人特征图进行池化得到全局特征;最后,同时使用身份约束和语义部位约束训练网络。在测试阶段,由于语义部位约束使得全局特征拥有部位信息,因此测试时仅使用主干网络提取行人的全局信息即可。在大规模公开数据集上的实验结果表明,语义部位约束能有效使得网络提高辨别行人身份的能力并且缩减推断网络的计算花费。与现有方法比较,该文网络能更好地抵抗背景干扰,提高行人再识别性能。  相似文献   

5.
本文提出了一个针对电商平台低质量图片进行文字分割的算法.汉字的主流识别方法主要为特征识别,结合置信度的词语句子识别和字库匹配识别.本文采用卷积神经网络进行识别单字,使用tesseract识别句子,结合两者修正字符,同时利用识别出的字符,对文字分割进行辅助分割,从而达到了极高的文字定位率.  相似文献   

6.
在需要实时大量输入汉字的显示控制处理应用中,利用传统单片机实现显示控制的设计方法是较难实现的.带汉字字库的液晶模块的使用使得小容量ROM单片机的大量汉字信息输入与显示成为可能.提出了针对汉字字库编码的二级索引拼音输入检索方法,介绍了以ST7920作为控制器的带汉字字库的液晶显示模块的接口方法及汉字显示和控制原理,给出了通用计算机键盘在单片机中的串行接口,采用该技术可大大增强单片机的汉字输入功能.为小容量ROM单片机的大批量汉字信息处理提供了一种汉字输入解决方案.  相似文献   

7.
目标自动识别是图像处理领域的研究热点。针对现有方法的不足,该文提出一种新的基于分等级对象语义图模型的复杂目标自动识别方法。该方法通过构建分等级对象语义图模型增强对目标与背景间、目标部件间语义约束的利用,引入置信对象网络统计局部特性,利用消息机制传递对象间相互影响,实现概率语义分析。训练中还将产生式和判别式方法结合,提高了目标识别的准确度。在自然和遥感部分目标类别数据集上的测试结果表明,该方法能完成对多种类型和复杂结构目标的识别和提取,具有一定的实用价值。  相似文献   

8.
提出了一种基于分层特征的群体行为识别方法。为了有效地描述识别信息,利用三层局部因果关系编码群体行为来描述运动特征,采用自我因果关系,双人因果关系,群体因果关系分别描述个人层级,双人层级,群体层级的运动特征,并结合外观特征来描述群体行为。最后,采用概率潜在语义分析(PLSA,Probabilistic Latent Semantic Analysis)模型进行群体行为识别。利用该方法在NUS-HGA这个数据集上进行了训练与测试,证明了该方法的有效性。  相似文献   

9.
残损纸币的自动识别   总被引:2,自引:0,他引:2  
本文利用图像处理技术对残损纸币的自动识别进行了探讨.主要采用PCA方法对可用币、旧币进行分析,得出两者的内在规律性差异,并采用组合判别的方法对旧币进行识别,这样既减少了识别过程的机器处理时间,而且算法适合于各种面额的纸币识别,处理速度快,识别率较好.  相似文献   

10.
中文临床电子病历命名实体识别是实现智慧医疗的基本任务之一.本文针对传统的词向量模型文本语义表示不充分,以及循环神经网络(RNN)模型无法解决长时间依赖等问题,提出一个基于XLNet的中文临床电子病历命名实体识别模型XLNet-BiLSTM-MHA-CRF,将XLNet预训练语言模型作为嵌入层,对病历文本进行向量化表示,解决一词多义等问题;利用双向长短时记忆网络(BiLSTM)门控制单元获取句子的前向和后向语义特征信息,将特征序列输入到多头注意力层(multi-head attention,MHA);利用MHA获得特征序列不同子空间表示的信息,增强上下文语义的关联性,同时剔除噪声;最后输入条件随机场CRF识别全局最优序列.实验结果表明,XLNet-BiLSTM-Attention-CRF模型在CCKS-2017命名实体识别数据集上取得了良好的效果.  相似文献   

11.
设计一个基于MATLAB/GUI的可视化文字图片识别系统。系统主要包含三部分,分别是图像预处理、文字分割和文字模板的匹配识别、GUI可视化界面设计。图像预处理包含图像旋转、图像裁剪、灰度变换、图像增强和二值化等;然后对二值化后的图像进行文字的分割,分割后的字符与数据库里面的文字模板进行匹配识别,最后输出识别的文字内容。处理算法调试成功后,设计一个可视化用户界面。系统完成后调试系统,输入样本图像检测识别结果。经多次测试,本系统可以较为准确地提取并识别图片上的文字信息。  相似文献   

12.
在应用软件封面的制作过程中,常需要某一特定尺寸的汉字,而通常的汉字系统不能提供。获得特殊汉字有两个办法,一是利用现有汉字系统的24(或16)点阵汉字库放大得到。但此法无论使用何种放大算法,显示的汉字总是带有锯齿;二是利用汉字系统提供的矢量字库进行放大,字型比较美观。但现有矢量字库的结构开发商一般不予提供,且算法复杂;三是制作自已的字库直接写屏显示,字形非常逼真。但字库的质量和制作速度难以保证。本文采用第三种方法,利用UCDOS 3.1的特殊显示功能制作字库,使字形的质量和制作速度都得到较好的保证。  相似文献   

13.
褚晶辉  董越  吕卫 《电视技术》2014,38(3):188-191
视频中包含的文字信息与视频的语义内容有很强的相关性,将视频中的文字信息提取出来进行分析处理可以有效地理解电视视频语义,从而实现对视频内容的安全监控。针对文字检测提出一种基于小波变换、角点特征图像和统计特征的有效方法,并运用基于彩色空间的文字提取方法获取二值图像,更有利于后面OCR的文字识别。  相似文献   

14.
《移动信息》2005,(6):64
语言从诞生到形成文字,经历的是语音和书写的传递过程,编码输入只是到近代计算机技术发展起来后才普及起来的。在手机上,汉字的编码输入主要包括拼音和笔画两大类,受地域方言的限制,拼音被南方语系的用户视为噩梦,对疏于拼音的中年以上的用户也是障碍,而笔画输入由于拆解复杂,并不为大多数用户所接受。在语音识别还不成熟的情况下,手写成为最被大众接纳的普及型输入方法。  相似文献   

15.
李征 《电声技术》2023,(11):38-40
文章深入探讨了智能语音新闻在语音识别、语义理解以及语音合成方面面临的挑战,并提出切实可行的解决路径。对于语音识别准确率不一致的问题,建议引入预训练语言模型来提升整体性能。针对语义理解能力有限的问题,强调发展多模态理解技术,综合不同感官输入提供更丰富的上下文信息。针对语音合成质量问题,提出训练个性化语音和应用生成对抗网络的策略。通过这些创新性的方法,智能语音新闻应用有望实现更高水平的语音交互和信息传递。  相似文献   

16.
本文强调了汉字输入方法的重要性。随着汉字信息处理技术的发展,已输入到计算机系统中的各种文字信息,一般不需要再通过打字输入就可以加以利用,因此在大多数情况下,需要输入到汉字信息处理机中的信息,往往就是操作者产生的原始信息。联想式人机对话输入方法特别适用于这一用途,其原理是:利用人机对话简化编码规则;利用上下文信息使大部分汉字不必进行编码即可输入。这种计算机辅助的输入方法使输入每个汉字的平均按键次数减少到1.5次,且等效键数仅为40。文中说明了实现人机对话和利用上下文的自适应特性的硬件和软件技术,也概述了利用微处理机控制的对话式汉字信息处理机研制工作的近况。  相似文献   

17.
命名实体识别与共指消解均依赖于对实体相邻文本信息的学习,本文提出一种基于混合神经网络的命名实体识别与共指消解联合模型,共用双向长短时记忆模型LSTM编码层对输入序列中每个词前后方向上下文信息进行编码,并通过训练学习得到上下文信息传递到前馈神经网络FFNN模型以提高共指消解精度,通过将领域文档及篇章语义向量加入FFNN,改进共指消解算法并优化共指消解模型.基于领域文本数据集进行联合模型训练,实验结果表明该联合模型可以有效地提高共指消解精度.  相似文献   

18.
该文提出一种基于判别邻域嵌入(DNE)算法的说话人识别。判别邻域嵌入算法作为流形学习方法的一种,可以通过构建邻接图获取数据的局部邻域结构信息;同时该算法可以充分利用类间判别信息,具有更强的判别能力。在美国国家标准技术研究院2010年说话人识别评测(NIST SRE 2010)电话-电话核心测试集上的实验结果表明了该算法的有效性。  相似文献   

19.
物联网视觉是新兴的信息感知技术,其可保证旅游景区异常情况图像的准确、高效识别。因此,设计基于物联网视觉的旅游景区异常情况图像自动识别系统。该系统采用图像采集预处理平台中的PIPER物联网智能摄像头采集旅游景区图像,并利用图像拆分方法筛选出异常情况图像。图像识别平台利用物联网射频识别技术,为图像采集预处理平台筛选出的异常情况图像,并提供惟一编码。系统通过编码确定异常情况位置,并给出处理意见。系统通过图像采集预处理平台的图像拆分目标函数,实现图像拆分工作的高品质运行。经实验验证可知,所设计的系统能够对旅游景区异常情况图像进行准确、高效识别。  相似文献   

20.
对颜体字的合成进行了研究,讲述了一种基于颜体部件来合成颜体字的软件实现过程。该软件以SQL Server数据库为管理系统,根据颜体字能够独立拆分的特性,对原有颜体字进行部件拆分编码,并通过Visual C++实现了颜体字部件图像合成的软件处理,合成了具有颜体风格的书法汉字,同时构建出合成颜体字所必须的完整的数据库。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号