首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
徐爽  张谦  李琰  刘嘉勇 《计算机应用》2018,38(5):1334-1338
为了更好地实现多源兴趣点(POI)数据的有效集成与精确融合,提出了一种结合空间与非空间属性的距离类别的兴趣点融合算法(MNMDC)。首先,对空间属性,通过标准化权重算法计算待融合对象的空间相似度得到融合集;其次,利用非空间Jaro-Winkle算法对融合集中类别一致的对象使用低阈值排除,对类别不一致的使用高阈值排除;最后,使用距离约束、类别一致约束和高阈值的非空间Jaro-Winkle算法找出空间算法遗漏的可融合对象。实验结果表明,该方法平均准确率达到93.3%,与空间和非空间算法(COM-NWT)及格网化纠正方法相比,在7组不同重合度的数据下MNMDC方法的平均准确率提高2.7和1.6个百分点、平均召回率提高2.3和1.4个百分点。MNMDC在实际融合过程中能更精确地融合POI数据。  相似文献   

2.
谢永华  韩丽萍 《计算机应用》2018,38(6):1765-1770
受显微传感器和不规则收集方法的影响,花粉图像常受到不同程度的噪声干扰且有着不同角度的旋转变化,识别精度普遍不高,为此提出了基于主梯度编码的局部二进制模式(DGLBP)描述子,并应用于花粉图像的分类识别。首先,计算图像块在主梯度方向上的梯度幅值;其次,分别计算图像块的径向、角向,以及复合梯度差;然后,根据各图像块的梯度差进行二进制编码,参照各局部区域的纹理分布情况为二进制编码自适应分配权重,并提取花粉图像在3个方向上的纹理特征直方图;最后,对不同尺度下的纹理特征直方图进行融合,采用欧氏距离计算各图像的相似度。DGLBP方法在Confocal和Pollenmonitor数据集上的平均正确识别率分别为94.33%和92.02%,与其他花粉识别方法相比平均提高了8.9个百分点和8.6个百分点,与LBP改进方法相比平均提高了18个百分点和18.5个百分点。实验结果表明,DGLBP描述子对花粉图像的噪声干扰和旋转变化具有较好的鲁棒性,且具有较优的识别效果。  相似文献   

3.
喻莹  杨扬  董才林 《计算机工程》2006,32(17):10-11,1
相似字多是造成汉字识别误识率和拒识率高的主要原因之一,该文提出了一种基于动态特征选择的相似字识别方法,其识别过程从初始提取全局特征开始,然后逐步动态地、递归地加入更精细的局部特征以提高识别的判决力,直至识别结果满足判决条件为止。这种方法不需要人工确定相似字组,而且能自动选择相似字间区别最大的部分空间,构成新的特征向量。通过实验验证,该方法使相似字的识别率有了显著提高,证明了该方法的有效性。  相似文献   

4.
基于机器学习的问题单分类方法无法捕获问题单的文本信息(如标题和描述)中的隐藏语义,从而有碍分类的准确性。为了解决上述问题,从GitHub的1 286个Java项目中,研究了794 601个问题单的标签用法,并识别6个常用的标签来描述问题单类别。提出一个语义增强方法DeepLabel,来自动地对问题单的类别进行分类。DeepLabel建立在神经网络架构上,用于学习问题单中标题和描述的语义表达及问题单和标签之间的语义关联。对30 000个有标签的问题单的实验评估结果表明,DeepLabel在宏平均(Macro-averaging)和微平均(Micro-averaging)的F1-socre上均达到了67.3%,分别较基准方法提高了8.1百分点和8.8百分点。  相似文献   

5.
利用支持向量机识别汽车颜色   总被引:3,自引:0,他引:3  
大类别数分类时支持向量机(SVM)数量较多,文中通过类别合并和特征空间分解,结合决策树判别方法.对SVM数量进行优化,提出了一种基于优化SVM的汽车颜色识别方法.该方法与最近邻分类方法相比,无论是在速度上还是识别正确率上都得到了提高.实验结果表明,该方法是一种快速且正确率较高的多类别分类方法,可以满足实时识别的要求.  相似文献   

6.
张永强 《计算机科学》2014,41(3):306-309
人体的运动过程较为复杂,图像中的相似动作很多,对传统的特征识别形成干扰,造成识别准确性不高。为了提高其识别正确率,提出一种Hu不变矩和人工鱼群优化支持向量机的人体运动姿态识别模型(Hu-AFSA-SVM)。首先,以二维连续图像为基础,提取图像中人体运动姿态识别的7个Hu不变矩,然后将其输入到SVM中进行训练,并采用AFSA对SVM参数进行优化,通过寻找一个最优超平面,尽可能在满足分类的限制条件下,将所有人体运动姿态分类数据集中的类别分开,在克服干扰下,完成识别。最后对其进行仿真实验。仿真结果表明,相对于其它识别模型,Hu-AFSA-SVM提高了人体运动姿态识别正确率,同时加快了识别速度,是一种有效的人体运动姿态识别方法。  相似文献   

7.
基于层叠条件随机场的旅游领域命名实体识别   总被引:3,自引:0,他引:3  
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。  相似文献   

8.
针对社交网络中用户抄袭难以识别的问题,为保障原创作者权益并对具有抄袭行为的用户进行追责,提出了区块链下社交网络用户抄袭识别方案。针对现有区块链缺少通用溯源模型的问题,设计基于区块链的溯源信息管理模型来记录用户操作信息,为文本相似度检测提供依据。在Merkle树和布隆过滤器结构的基础上,设计了新的索引结构BHMerkle,减少了区块构建和查询时的计算开销,实现了对交易的快速定位。同时提出多特征权重Simhash算法,提高了词权计算的准确性并提高签名值匹配阶段的效率,从而对具有抄袭行为的恶意用户进行识别,并通过奖惩机制遏制恶意行为的发生。抄袭识别方案在不同主题的新闻数据集上的平均准确率为94.8%,平均召回率为88.3%,相较于多维度Simhash算法和基于信息熵加权的Simhash(E-Simhash)算法,平均准确率分别提升了6.19、4.01个百分点,平均召回率分别提升了3.12、2.92个百分点。实验结果表明,所提方案在抄袭文本的查询及检测效率方面均有所提升,且在抄袭识别方面具有较高的准确性。  相似文献   

9.
汤浩  何楚 《计算机应用》2016,36(12):3436-3441
传统合成孔径雷达(SAR)图像基于粗分割像素块提取相关特征,后接支持向量机(SVM)和马尔可夫随机场(MRF)或条件随机场(CRF)进行分类,该方法存在同一像素块内部不同类别像素的误差,而且只考虑邻近区域未充分用到全局信息和结构信息。故考虑基于像素点引入全卷积网络(FCN),以ESAR卫星图像为样本,基于像素点级别构建卷积网络进行训练,得到各像素的初始类别分类概率。为了考虑全局像素类别的影响后接CRF-循环神经网络(CRF-RNN),利用FCN得到的初始概率,结合CRF结构得到全局像素类别转移结果,之后进行RNN的迭代进一步优化实验结果。由于基于像素点和考虑了全局信息与结构信息,克服了传统分类的部分缺点,使正确率较传统SVM或CRF方法平均提高了约6.5个百分点。由于CRF-RNN的距离权重是用高斯核人为拟合的,不能随实际训练样本来改变和确定,故存在一定误差,针对该问题提出可训练的全图距离权重卷积网络来改进CRF-RNN,最终实验结果表明改进后方法的正确率较未改进的CRF-RNN又提高了1.04个百分点。  相似文献   

10.
基于临界频带及能量熵的语音端点检测   总被引:1,自引:0,他引:1  
张婷  何凌  黄华  刘肖珩 《计算机应用》2013,33(1):175-178
语音端点检测的准确性直接关系着语音识别、合成、增强等语音领域的准确性,为了提高语音端点检测的有效性,提出了一种基于临界频带及能量熵的语音端点检测算法。算法充分利用人耳听觉特性的频率分布,将含噪语音信号进行临界频带划分,并结合各频带内信号的能量熵值在语音段和噪声段的不同分布,实现不同背景噪声下语音端点检测。实验结果表明,提出的语音端点检测算法与传统的短时能量法相比,检测正确率平均高1.6个百分点。所提方法在不同噪声的低信噪比(SNR)环境下均能实现语音端点检测。  相似文献   

11.
将粗分类应用于脱机手写汉字识别中,采用这种多层次分类策略,能有效地改善识别的性能,提高识别精度。本文提出了一种利用四角区域结构特征对手写汉字进行粗分类的方法。在对汉字基本笔画进行分析的基础之上,根据手写汉字形变的特点以及识别算法的要求,定义一组新的笔画单元,并将这些笔画单元与汉字特定区域内的结构进行比对,得到一组4位结构特征编码,以此作为脱机手写汉字粗分类的依据。对GB2312一级字库中的部分手写汉字进行采样和识别实验,结果证明改进的四角结构特征用于粗分类的有效性。  相似文献   

12.
针对银行支票图像大写金额的无限制手写体汉字识别问题,进行了基于密度均衡原则的非线性规范化研究。提出了一种改进的非线性规范化方法.该方法定义的基于笔画间距和宽度的密度函数,不仅能较好地克服笔画变形的局部性、不规则性,而且能使同一字符内以及不同字符之间的笔画粗细趋于一致;同时,确定了图像中字符的有效区域,并据此改进了基于密度均衡原则的通用表达式,有效地解决了字符整体倾斜和单个笔画比较突出的问题,实验结果表明:该方法比其他同类方法效果更佳,可使银行支票图像的大写金额识别系统的识别正确率提高约1.5%。  相似文献   

13.
数学公式字符的定位对整个印刷体中文文档识别系统而言是提高其识别率的重要内容之一。在介绍典型的数学公式字符定位技术的基础上,提出了一种新的两级公式字符定位方法。该方法是采用了印刷体中文文档中不同字符之间的投影分布特征的不同与汉字识别拒识公式字符的思想结合起来对公式字符进行定位。从实验结果可以看出该定位方法能够在公式字符定位的准确率和时间上有了较大的改进,为提高印刷体中文文档识别系统的识别率奠定了基础。  相似文献   

14.
王建平  蔺菲  陈军 《计算机工程》2007,33(10):230-232,248
提出了手写体汉字笔画宽度提取、基于提取出的笔画宽度归一化手写体汉字的方法,给出手写体汉字笔画重构的思想,实现了一种基于手写体汉字笔画提取的汉字重构并最终识别手写体汉字的算法,构建了手写体汉字的识别系统。实验证实,该方法可保证原有笔画特征信息,且能有效地识别手写体汉字。  相似文献   

15.
食品、药品包装上的点阵字符信息一般包含生产日期和其他重要信息。针对目前单一的点阵字符识别方法准确率不高,且对点阵字符在复杂环境下(既包含点阵字符又包含连续字符)字符定位准确性低的问题,提出了一种基于模板匹配和支持向量机(Support Vector Machine,SVM)的组合点阵字符识别方法。该方法利用点阵字符的离散性质来准确定位点阵字符,然后分别通过基于灰度的模板匹配和基于特征的模板匹配方法得到两个判定结果。若判定结果相同,则识别出字符;若判定结果相异,将这两个结果送给SVM进行识别,得出识别结果。实验结果表明,该方法在点阵字符的定位准确性和识别率方面都优于传统字符识别方法,且识别鲁棒性较好,字符识别率达到96.10%。  相似文献   

16.
随着计算能力的飞速增长、训练数据的不断积累以及非线性激活函数的不断完善,卷积神经网络(CNN)在手写体汉字识别中表现出较好的识别性能。针对CNN识别手写体汉字识别速度慢的问题,将二维主成分分析(2DPCA)与CNN相结合识别手写体汉字。首先,利用2DPCA提取手写体汉字的投影特征向量;然后,将得到的投影特征向量组成特征矩阵;其次,用组成的特征矩阵作为CNN的输入;最后,用Softmax函数进行分类。与基于AlexNet的CNN模型相比,所提方法的运行时间降低了78%,与基于ACNN与DCNN的模型相比,所提方法的运行时间分别降低了80%与73%。实验结果表明,该方法在不降低识别精度的同时,可以减少识别手写体汉字的运行时间。  相似文献   

17.
Recognition of Chinese characters has been an area of major interest for many years, and a large number of research papers and reports have already been published in this area. There are several major problems with Chinese character recognition: Chinese characters are distinct and ideographic, the character size is very large and a lot of structurally similar characters exist in the character set. Thus, classification criteria are difficult to generate. This paper presents a new technique for the recognition of hand-printed Chinese characters using the C4.5 machine learning system. Conventional methods have relied on hand-constructed dictionaries which are tedious to construct and difficult to make tolerant to variation in writing styles. The paper discusses Chinese character recognition using theHough transform for feature extraction and C4.5 system. The system was tested with 900 characters written by different writers from poor to acceptable quality (each character has 40 samples) and the rate of recognition obtained was 84%.  相似文献   

18.
手写文本识别方法主要应用于文本输入技术,对人机交互领域的发展起关键作用。针对多数在线输入法无法识别中英文混合手写识别的问题,提出一种在线中英文混合手写文本识别方法。通过对文本笔画进行基于水平相对位置、垂直重叠率、面积重叠率规则的整合以及连笔切分,得到一系列字符片段,同时利用笔画个数、宽高比、中心偏离、平滑度等几何特征和识别置信度,对字符片段进行中英文分类。在此基础上,根据分类结果并结合自然语言模型的路径评价及动态规划搜索算法,分别对候选的中、英文字符片段进行合并处理,得到待识别的中、英文字符序列,并将其分别送入卷积神经网络的中、英文识别模型中,得到手写文本识别结果。实验结果表明,在线手写中英文混合文本识别正确率达93.67%,不仅能切分在线手写中文文本行,而且对包含字符连笔的在线手写中英文文本行也有较好的切分效果。  相似文献   

19.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

20.
MST在手写汉字切分中的应用   总被引:7,自引:0,他引:7  
韩勇  须德  戴国忠 《软件学报》2006,17(3):403-409
手写汉字切分是根据输入笔迹的空间位置关系进行汉字部件的合并切分,形成完整的汉字笔划以便进行识别处理.综合利用了汉字部件的结构位置关系和笔划的空间位置关系,根据笔划的最小生成树(minimal spanningtree,简称MST)对联机连续手写输入汉字进行切分,取得了较好的切分结果.切分的准确率超过91.6%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号