首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 156 毫秒
1.
结合WTLBP特征和SVM的复杂场景文本定位方法   总被引:2,自引:0,他引:2  
针对自然环境中文字结构差异性大,文字和非文字难以有效区分而造成定位虚警率较高的问题,提出利用小波变换(WT)和多尺度LBP算子相结合的方法(WTLBP)提取文字特征,并将其用于对候选文字区域的分类确认,以降低文本定位虚警率.算法首先利用文字笔画边缘实现快速的文本区域检测,获得候选的文字区域;然后,提取候选文字区域的WTLBP纹理特征,结合支持向量机(SVM)分类器对候选文字区域进行分类确认.实验结果表明, WTLBP文字特征具有较高的区分度,能够有效区分文字和非文字区域,将其用于对候选区域的分类确认可大大降低复杂场景中文本定位虚警率.  相似文献   

2.
文字识别作为模式识别的一个重要方面,其研究获得广泛重视。本文基于粗集理论的观点,把文字识别问题看作是模式识别中简化知识表态与信息分类处理问题,提出一种新的文字识别方法,这不仅对模式识别中如何提取有用特征是一种新的探索,而且对简化信息处理也是一种新的方法。本文介绍了基于粗集理论的文字知识表达的方法,探讨了模式识别中的特征提取及最小决策算法,并给出一人上文字识别的例子来说明这种有效的方法。  相似文献   

3.
根据仅知道碎纸机横纵切破碎中文纸片的文字之间存在统一的文字高度和行间距等文字特征,提出在匹配拼接前,把碎纸片的二维图像通过横向投影方式转变为保留文字高度、行间距等特征的一维向量,并利用它进行分层聚类,对所有碎纸片进行行分类,从而有效地减少匹配拼接的时间,提高匹配拼接正确性,实验结果表明,该方法精确,有效.  相似文献   

4.
为了解决 ART2神经网络的漂移问题,提出了一种改进的基于 ART2神经网络的文字分类和识别方法.此方法能够自主学习,收敛速度快,识别率和识别速度都比 BP神经网络高.实践证明,基于此设计的脱机手写体文字识别系统能对较规范的手写体文字进行识别,识别率达到85%.  相似文献   

5.
提出一种新的基于退化隐马尔柯夫模型的印刷体文字识别方法.此方法按照一定规则提取文字的一维笔段序列特征,然后将该特征输入到设计好的分类器中进行分类.在分类器的设计上摒弃传统的左右型结构模型,采用了遍历型结构模型.实验证明此方法能够更好地完成文字分类任务,识别率可以达到99%以上.  相似文献   

6.
表情符号已成为网络语言重要组成部分,是分析社交媒体情感的主要特征之一.目前分析社交媒体情感符号的方法多针对Emoji,对颜文字的情感倾向没有相应分析.为获取中文媒体的多维度情感并分析热点话题的群体情感走向,本文以微博为例提出一种新的融合表情符号与短文本的多维情感分类方法.在该框架中,采用深度学习模型分析文本与Emoji组合部分、颜文字部分,分别计算两部分的7种情感强度,挖掘各部分与情感标签的深层次关联,并设计计算模型来反映语句包含的多维情感属性,实现对语句多维情感强度的检测.实验选择NLPCC2014数据集和爬取的带有颜文字的微博数据集进行验证,实验证明当文本与Emoji组合、颜文字占比分别为0.6和0.4时情感分类效果最好,且含颜文字的语句情感分类性能指标始终高于不含颜文字的语句,这表明融合表情符号和短文本的形式有效提高了情感检测精度.该方法为研究群体情感趋势提供了更细粒度的分析,为中文社交媒体的情感分析提供了新思路.  相似文献   

7.
针对文本图像文种识别中特征提取速度和识别精度之间的矛盾,提出了一种基于文字笔画方向直方图的文种识别方法,利用笔画方向直方图对不同文种文字的笔画方向分布差异进行描述并提取特征,采用支持向量机对所提特征进行训练和分类,实现文字种类识别。在实验中选用有质量退化的中、英、俄、日、韩、阿拉伯等10种不同语言文字文本图像。实验结果表明,本方法运算速度快,有较高的识别准确率并对图像质量退化有较好鲁棒性。  相似文献   

8.
在分析朝鲜文字有关特征的基础上,讨论了手写体朝鲜文字识别的预分类特征提取方法。  相似文献   

9.
本文提出了一种计算机判阅文字录入错字的统计算法.该算法通过对录入文字的频度进行统计,并与范文的文字频度进行比较从而确定文字录入中的错字数;对算法的误差作了详细的分析,有效地解决了判阅错、漏、多字的问题.  相似文献   

10.
计算机判阅文字录入的一种统计算法   总被引:1,自引:0,他引:1  
本文提出了一种计算机判阅文字录入错字的统计算法。该算法通过对录入文字的频度进行统计,并与范文的文字频度进行比较从而确定文字录入中的错字数;对算法的误差作了详细的分析,有效地解决了判阅错,漏,多字的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号