首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了解决场景文字检测受到背景复杂、光照不均等环境因素及文字本身属性变化的影响,提出一种基于Gabor滤波与边缘特征的场景文字检测方法。有效地融合了图像的纹理特征与边缘信息来得到文本候选区;经过形态学处理与投影运算对文字区域进行定位;最后通过一种特殊的二值化处理实现文字的提取。实验表明,该方法能检测各种场景下的文字。  相似文献   

2.
基于细化的西夏字笔划提取方法研究   总被引:1,自引:0,他引:1  
西夏文字字数多、字形复杂、形态相似的字多,受手工书写因素的影响,同一个字的模式变化很大。文章提出了一种西夏字笔划提取方法。  相似文献   

3.
基于笔划特征的手写体汉字字符识别   总被引:1,自引:0,他引:1  
本文提出了一种利用笔划提取骨架结构特征的手写体汉字字符识别方法。首先,以二进制字符模式的直线长度来决定笔划的方向,根据其方向和它们相互关系,将笔划分为笔划段和分叉段,然后提取笔划的骨架,亦称之为骨架段,在提取了所有的轮廓段后,对分叉段进行处理,找到分叉点和分叉角。轮廓段和分叉段在分叉点处相连,这样所有相连的骨架段构成了字符的骨架,根据提取的轮廓和分叉点,我们可以得到用于识别的基本笔划和笔划方向图。  相似文献   

4.
介绍了一种基于细化的手写体汉字笔划交叉点提取的方法.在众多笔迹算法中,大部分把笔划作为对象进行研究,而要得到准确的笔划特征,难点在于能够准确地确定其交叉点,在交叉点提取过程中,经常会丢失重要的交叉点和产生伪交叉点,提出的新的基于邻域特征的交叉点提取算法可以避免这种现象,实验结果证明了该算法的有效性.  相似文献   

5.
基于形状分割的手写汉字笔划提取方法   总被引:1,自引:0,他引:1  
笔迹鉴别的目的是区分不同的书写者,而笔划提取是笔迹鉴别的基础。本文提出了一种用于笔迹鉴别的手写汉字笔划提取算法,该算法定义了凹凸点与四种基本笔划相交类型的对应关系,通过字符图像轮廓上的凹凸点检测来确定笔划相交区域和相交类型;接着,在各个相交区域上,根据其笔划相交类型进行形状分割;最后,用对笔划轮廓两侧对应点进行跟踪的方法来进行细化。我们将该算法与基于细化和基于段化的笔划提取算法进行比较,实验结果表明,该提取算法具有比较高的准确率和有效性,因此本文提出的基于形状分割的手写汉字笔划提取方法具有较高的可操作性和实用价值。  相似文献   

6.
基于笔划特征的单字符汉字字体识别   总被引:1,自引:0,他引:1  
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.有别于目前基于多个字符组成的文本块的字体识别方法,本文提出了一种基于单个汉字字符的字体识别方法.在单个汉字字符上提取两类特征:笔划属性特征和笔划分布特征,分别构成两个分类器对单个汉字字符进行字体识别,并集成两个分类器的结果得到最终的识别结果.我们使用的笔划属性特征分类器是文本无关的,而笔划分布特征分类器是文本相关的,集成的分类器属于文本相关的字体识别分类器.我们在包含7种字体的样本集上进行了测试,测试结果显示基于单字的字体识别率达到94.48%.  相似文献   

7.
基于笔划特征的宋体字形衍生方法   总被引:3,自引:1,他引:2  
本文介绍了基于笔划特征的轮廓汉字字形衍生方法, 并叙述了宋体轮廓汉字衍生系统在微型计算机上的设计与实现。  相似文献   

8.
本文论述了基于汉字笔划骨骼运笔特征的笔迹鉴定的方法。实验以汉字中抽取的基本笔划为研究对象,并提取反映各行笔部运笔的骨骼特征,以形成多维持征空间,在特征空间中确定鉴定对象的分布后,计算它与辞书中各书写者位置间的广义距离来实现笔迹的鉴定。判断鉴定对象是否自出于原书写者的方法即为特定对象鉴定法,该方法采用对十位书写者、八种基本笔划,每种笔划十个样本进行测试,结果显示对于单一笔划和笔划组合取得了令人满意的鉴定率,对推广和完善该实用性的研究具有参考价值。  相似文献   

9.
多数信息系统对数据过滤的处理是以硬编码的方式实现。本文提出的方案以场景为基础,结合授权机制,可对数据隔离规则进行灵活的扩展。实践说明,该方案可极大地提高编码效率和代码的可靠性,降低了业务实现的复杂度。  相似文献   

10.
针对场景文字区域尺度变化较大,具有较大的长宽比,且具有任意方向性等问题,提出一种基于神经网络的场景文字检测模型.基于直接回归方法设计,无需预先设置锚框,在多次层次构建特征,且在多个分支之间共享卷积核.实验阶段在多个数据集上验证了模型的有效性,相较于现有方法,该模型计算资源消耗更小,推理速度更快,整体性能更好.  相似文献   

11.
基于混合模式的文本过滤模型   总被引:16,自引:1,他引:15  
文本过滤旨在帮助用户处理自己感兴趣的文本,提出了基于混合模式的文本过滤模式,其基本思想是将基于内容的过滤方法和合作过滤方法结合起来,给出了用户评沪的权威性和一致性度是,以便更好地运用用户的评注信息,在此基础上,结合用户的个人兴趣,给出了文硒特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制,该方法不依赖于具体的领域知识库,大大降低“噪音”影响,并可以适用于多媒体类型文件的过滤和信息服务。  相似文献   

12.
提出一种基于全局场景特征在视频序列中寻找频繁镜头集合,并通过局部语义特征精确定位视频场景边界的视频场景分割方法。首先对分析视频进行高精度镜头分割,选取具有代表性的镜头关键帧。然后提取各镜头关键帧的全局场景特征和局部特征,并利用局部特征聚类得到的视觉词对各个镜头关键帧进行语义标注。接下来计算基于全局场景特征的镜头间相关性,结合视频场景的概念和特性,在镜头关键帧序列中寻找局部频繁出现的相关性高的镜头集合,粗略定位视频场景位置。最后利用镜头关键帧的语义标注特征精确定位视频场景边界。实验证明该方法能够准确、有效地检测并定位到大部分视频场景。  相似文献   

13.
针对网页的多样性、复杂性和非标准化程度的提高,提出一种基于SVM及文本密度特征的网页信息提取方法。该方法先将网页整体解析成DOM树,然后根据网页结构提出五种网页密度特征,用数学模型进行密度比例分析,并采用高斯核函数(RBF)训练样本数据。该方法训练出的数据模型能够准确地去除网页广告、导航、版权信息等噪音信息,保留正文信息块,最后进行正文信息块内除噪。实验表明,该方法不仅有较高的精度,而且通用性好。  相似文献   

14.
企业收集和获取用户个人信息是其对用户行为进行分析以制定合理营销决策的前提。注意到当前,由于互联网的高度发展和普及,消费用户往往在Web上以评论文本的形式分享其消费习惯、消费偏好和消费体验,这些海量的评论文本中蕴含着极具价值的信息,为用户个人信息的收集提供良好的资源。针对传统企业收集用户个人信息的方法主要以人工为主导,自动化水平较低的问题,提出一种基于Web挖掘技术以网上评论文本为挖掘对象,对用户个人信息进行自动提取以自动分析用户行为的改进方法。企业可以通过此改进的用户个人信息提取方法对用户行为进行分析以自动获取消费用户对产品的反馈意见并制定有针对性的营销策略。  相似文献   

15.
面对实时网络信息过滤的新挑战,自适应信息过滤能够解决问题。针对现有自适应系统的不足,提出了提高模板准确性的学习和过滤阈值优化的新方法。采用增量迭代学习算法来逼近真实的过滤模板,结合非法网页的分布函数自适应调整阈值,不断提高过滤精度,并运行于一个校园网关之上,取得了较好的效果。  相似文献   

16.
根据电子邮件中正常邮件和垃圾邮件的概率特性,将在信号处理领域应用广泛的最大熵模型引入到邮件过滤中,并结合邮件的半结构化特性,形成邮件特征向量,给出传统特征函数的改进定义.在此基础上,构造出基于最大熵模型的邮件过滤方法的基本框架.实验结果表明,这种过滤方法表现出了良好的性能.  相似文献   

17.
Abstract

In this paper, I continue to study the alternative hierarchical analysis method that was initialed in [Saaty, 1976]. Instead of using pairwise ratio matrices, this method uses pairwise subtraction matrices. By doing so, computational complexity is reduced significantly, and as shown by a statistical experiment described in this paper, the two methods lead basically to the same results. Furthermore, this method provides an optimal solution in the sense of minimizing an appropriate error function. Due to the significant reduction in computational complexity, fuzzy hierarchical analysis based on pairwise subtraction matrices becomes more manageable. Finally, I point out a new application area of the hierarchical analysis: estimating crisp or fuzzy prior probability distributions for Bayesian inference with imprecise probabilities.  相似文献   

18.
随着互联网信息的快速剧增,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义.目前研究热点是基于语义的过滤方法,但是这些方法一般都需要大量规则和领域知识的支持,可用性不是很好.为了使机器更好地理解用户需求和文本内容,使过滤结果更能反映用户的真正需求,提高文本过滤的准确率和召回率,提出了基于用户本体模型UOM的文本信息过滤方法.该方法主要包括UOM构建、文本结构分析、文本概念提取和语义相关度计算等.基于UOM(User Ontology Model)的过滤方法,不仅可以表示复杂的用户需求,而且还避免了领域本体的构建,因而其有效性和实用性得到了很大的提高.通过在网络教学资源的智能按需服务系统中的实际运用,表明此方法能更有效地为用户提供过滤服务.  相似文献   

19.
文本分类是在给定的分类体系下,根据文本的内容自动确定文本类别的过程.在文本分类中,特征的提取对于分类的结果相当重要.从特征提取这一阶段出发,提出了一个集成合并的特征提取方法,该方法主要集成多种特征提取方法并合并关系密切的特征,并利用支持向量机SVM(Support Vector Machine)分类的高准确率,能够求出全局最优方法等优点来对得到的特征向量进行分类评估.实验证明,此种特征提取能够降低分类时间和提高分类的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号