期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

HCL2000手写汉字数据库的更新及相关研究 总被引：2，自引：0，他引：2

任俊玲郭军《中文信息学报》2005,19(5):99-106

HCL2000 是目前最具影响力的手写汉字数据库之一,基于研究手写汉字规律的设计初衷,该数据库采用了以书写者为单位按文件形式组织和存放的方式。本文则从研究样本选择的应用角度出发,对HCL2000中的样本进行了重新组织,同时对该数据库中的错误进行了纠正,生成了一个新的手写汉字数据库HCL2004。文章最后基于HCL2004 数据库和方向线素特征进行了有关训练样本数对识别性能影响的研究,给出了3755类大字符集情况下的最佳训练样本数为300 的结论,同时还对识别过程中的样本选择问题进行了探讨。相似文献

2.

基于置信度分析的脱机手写数字识别算法

高建清陈星娥《数字社区&智能家居》2011,(7X):5202-5204

该文主要研究了脱机手写数字识别中的特征选择与提取和分类器的设计问题,选取了网格特征和交叉点特征,采用了最小距离分类器和基于Fisher判别的线性分类器,并使用基于置信度分析的方法进行混合集成,提高了识别正确率。相似文献

3.

基于实时样本采集的个性化手写汉字输入系统设计

张帆刘星张宇《计算机测量与控制》2018,26(1)

手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。相似文献

4.

基于样本选择的标签含噪图像分类

闻铮曹国《计算机系统应用》2024,33(2):54-61

标签噪声广泛存在、无法避免且影响深度网络模型的性能. 利用神经网络的“记忆效应”, 基于小损失原则的样本选择方法能简单有效地处理标签噪声. 本文基于特征空间中样本距离越近越相似的原则, 结合样本的高低置信度假设, 提出了新的样本选择原则以及二阶段加权样本选择重标签方法(WSSR-2s). (1)在训练前期阶段, 对于高置信度样本, 在特征空间中对其票权进行加权, 更好地引导训练; (2)在训练中后期阶段, 对于低置信度样本, 将其票权转移给其最相似的特征样本, 以更正确地训练. 在合成噪声数据集CIFAR-10、CIFAR-100以及真实噪声数据集ANIMAL-10N、WebVision的实验结果表明, 本文提出的方法取得更高的精度, 能够更好地处理标签噪声问题. 相似文献

5.

基于子空间样本选择的最近凸包分类器 总被引：3，自引：0，他引：3

下载免费PDF全文

周晓飞姜文瀚杨静宇《计算机工程》2008,34(12):167-168

最近邻凸包分类器需要求解测试样本到训练集凸包距离的凸二次规划问题,对于训练集规模较大的情况,有必要在分类之前进行适当的样本选择。为此该文提出基于子空间样本选择的最近凸包分类方法。该方法首先采用子空间样本选择算法对训练集样本进行筛选,然后将各类选出的样本作为最近邻分类器的新的训练集。子空间样本选择方法的原理是在一类训练样本集内,迭代选择距离已选样本张成子空间最远的样本。在MIT-CBCL人脸识别数据库的training-synthetic子库的实验中,该方法只需5.6%的训练样本即可取得100%的识别率,并且执行时间较未经选样的最近邻凸包分类器也大为减少。相似文献

6.

广义神经网络系统与广义BP算法

王耀李涛《小型微型计算机系统》2001,22(8):967-970

本文在传统的神经网络理论基础上,将传统的神经元拓广为广义神经元,描述了以广义神经元为基础的广义神经网络系统的组成原理,提出了适应于广义神经网络系统的一种广义BP算法。并给出了该算法的数学推导,最后简要地介绍了广义神经网络系统原理在汉字识别中的应用。相似文献

7.

改进的广义置信度自适应IFS图象压缩编码算法

下载免费PDF全文

曹云朝陈贺新于松宇《中国图象图形学报》2001,6(12):1175-1179

通过对分块IFS图象压缩编码过程中匹配误差的分析,提出了广义置信度的概念,并据此提出了对输入图象进行四叉树分块的自适应匹配门限（AT）算法。根据排列块的相对复杂程度,修正了自适应匹配门限的公式,提出了改进的自适应门限（RAT）IFS图象压缩编码算法。在对输入图象进行四叉树分块编码过程中,该方法可以根据当前排列块的统计特征确定匹配门限,从而使分块编码过程自动地适应输入图象。实验结果表明,这种新的编码方法可以自适应地对输入图象进行编码,且压缩比较高,有一定的实用性。相似文献

8.

基于均值近邻的样本选择算法

《微型机与应用》2014,(17):80-82

提出了一个基于均值近邻的样本选择算法,并且对CMU-PIE人脸数据库数据进行了样本选择,提取关键数据,结合神经网络算法进行了分类实验。实验结果证明,与传统方法相比,该方法在保持了一定的准确率的前提下,能够有效地减少样本集中的冗余信息,同时在时间复杂度方面也有了一定的提升。相似文献

9.

基于粗糙集理论的模式分类样本特征选择方法研究 总被引：1，自引：0，他引：1

陈曦《计算机应用与软件》2003,20(2):9-10,38

本文提出了一种基于粗糙集理论的模式分类本特征选择方法，该方法应用粗糙集理论和方法，对给定的学习样本进行特征选择，根据这些特征构造神经网络模型进行训练，并在网络的工作阶段，根据这些特征对待识样本进行分类，在模式分类中，该方法能够减少网络的训练时间并改善网络的泛化能力。相似文献

10.

联机手写汉字识别的原理,方法与实践

王江伟《中国计算机用户》1995,(3):52-55

目前,联机手写汉字识别系统在笔输入计算机方面已得到较成功的应用,相对传统的汉字编码输入法,笔输入法简单直观、勿须学习,因而迅速为人们所接受,联机手写汉字识别技术也随之成为人们关注的焦点。一、汉字识别概述和联机识别的特点汉字识别是模式识别的一个分支,其任务是研究如何使计算机“识字”。汉字识别系统通常采用光电转换装置(数字化仪、光笔、鼠标器等)把汉字或字符相似文献

11.

一种基于置信度的代表点选择算法

黄云洪佳明覃遵跃《计算机工程》2012,38(19):167-169,174

代表点选择是实现缩减数据集规模的有效途径,可以提高分类的准确率和执行效率.为此,通过引入分类置信度熵的概念,提出适应度评价函数,用于评估代表点的选择效果,以此找到最优的代表点集.该方法可与其他代表点选择方法结合,得到性能更优的代表点选择方法.与多个经典代表点选择方法进行实验比较,结果表明基于置信度的代表点选择方法在分类准确率和数据降低率上有一定优势. 相似文献

12.

基于Filter Wrapper模式的特征选择算法*

周传华柳智才丁敬安周家亿《计算机应用研究》2019,36(7)

特征选择是数据挖掘、机器学习和模式识别中始终面临的一个重要问题。针对类和特征分布不均时,传统信息增益在特征选择中存在的选择偏好问题,本文提出了一种基于信息增益率与随机森林的特征选择算法。该算法结合Filter和Wrapper模式的优点,首先从信息相关性和分类能力两个方面对特征进行综合度量,然后采用序列前向选择（Sequential Forward Selection, SFS）策略对特征进行选择,并以分类精度作为评价指标对特征子集进行度量,从而获取最优特征子集。实验结果表明,本文算法不仅能够达到特征空间降维的效果,而且能够有效提高分类算法的分类性能和查全率。相似文献

13.

基于遗传算法的原型模式选取算法 总被引：4，自引：1，他引：4

王海龙戚飞虎詹劲峰《计算机工程》2000,26(9):19-20,122

该文了原型模式选取对协同方法的模式识别性能有着非常重要的作用,并提出了一种基于遗传算法的原型模式选取算法,对从实际应用中获得的样本进行的实验证明：新算法能有效地在原型模式空间搜索全局最优解,使协同方法的识别性能有较大提高。相似文献

14.

并行散列选择算法

下载免费PDF全文

钟诚《计算机工程与科学》2000,22(3):32-35

基于散列方法、分级原理和弃大留小筛选原理,通过构造线性单调的散列函数,给出一种（ｍ,ｎ）选择问题的并行算法,并分析算法在具有ｐ个处理机的共享存储并行系统模型上实现的复杂性。理论分析和仿真实验结果表明,本算法是一种可伸缩、简明实用、快速的并行选择算法。相似文献

15.

基于FP树的多最小支持度广义关联规则挖掘算法

佘俊胜黄战李亚丹《小型微型计算机系统》2007,28(12):2212-2215

采用MIS-tree结构保存频繁模式的信息提出了基于频繁模式增长挖掘原型的CFP-tax算法,该算法可避免候选集的生成和高代价的数据库扫描并能高效地找出数据库中所有频繁项集.基于虚拟数据集对算法的性能进行了评估,结果表明CFP-tax算法比经典的MMS-Cumulate算法性能有显著的提高. 相似文献

16.

一种基于自然语言的模式推理算法

王树西赵星秋刘瑞林黄健青《计算机科学》2006,33(12):139-141

传统的基于谓词模式推理算法,需要把自然语言表示的知识,人工转换为机器可以理解的谓词,这就需要耗费大量的人力物力。本文提出一种基于自然语言的模式推理算法,可以基于自然语言进行模式推理,不需要将自然语言表示的知识转换为谓词,从而大大节省了人力物力。实验结果表明,本算法可以基于自然语言,有效的进行模式推理。相似文献

17.

基于广义信息距离的直接聚类算法

丁世飞史忠植靳奉祥夏士雄《计算机研究与发展》2007,44(4):674-679

提出了基于广义信息距离的直接聚类算法.基于信息理论给出了离散量的基本概念,讨论并证明了离散量的一个基本不等式,进而给出了离散增量的概念.在分析距离测度的基础上,提出了广义信息距离(GID)、改进的广义信息距离(IGID),建立了基于GID,IGID的直接聚类算法,并对土地肥力数据资料进行了聚类分析.结果表明,建立的算法与传统的聚类算法相比,算法原理简便、对数据本身的维数与分布要求不高,且具有较好的聚类效果. 相似文献

18.

An Improved Prototype Pattern Selection Algorithm

Fang Xiuduan Liu Binhan WANG Weizhi 《计算机科学》2002,29(Z1):134-136

［1］Wang Hai Long,Qi Feihu. The Learning Algorithm Based on Superposition of Information. Journal of Infrared Millim. Waves,2000,19(6) ［2］H. Haken. Synergetic Computers and Cognition, Vol. 50 of Springer Series Synergetics. Springer,Berlin, 1991 ［3］Wagne 相似文献

19.

基于连续映射小脑模型的广义预测控制快速算法 总被引：2，自引：0，他引：2

谢永斌罗忠冯祖仁胡保生《控制理论与应用》1997,14(6):842-846

文中把改进后的小脑模型（ＣＭＡＣ）应用于广义预测控制（ＧＰＣ）算法中，避免了该算法需实时进行的复杂计算，本文的方法对ＧＰＣ在实际中的应用有重要的意义。相似文献

20.

一种基于克隆选择的动态聚类算法

黄琳陈耀文《微计算机信息》2007,23(27):255-257

本文在克隆选择免疫算法和层次聚类的基础上,提出一种动态聚类算法。该算法无需先验知识,首先初始化与抗原相同规模的抗体,然后根据亲和力进行抗原识别、抗体抑制和合并,完成一轮聚类;再利用aiNET免疫网络模型动态确定聚类后的抗体的变异方向,实施强目的性变异,变异率反比例于进化代数动态调节,使变异后相似的抗体进一步合并,如此反复直到满足终止条件。仿真的实验结果表明,该算法比传统的聚类方法具有更好的聚类结果和更高的性能。相似文献