首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
该文主要对文本自动分类的特征选择方法进行了讨论,分析了几种常见方法存在的缺陷,指出影响出文本特征选择的两个重要因素——特征项在类别内的文档频率和在类别间的分布差异,并以这两个因素为影响因子分别对TF-IDF和IG方法进行了改进。另外还介绍了朴素贝叶斯分类模型,并基于此模型对改进的特征选择方法的分类效果进行评估。实验结果表明,改进后的方法能够强化特征项在特定类别中的影响力,提高文本分类效果。  相似文献   

2.
一种改进的决策树分类属性选择方法   总被引:2,自引:0,他引:2       下载免费PDF全文
分析了ID3算法的基本原理、实现步骤及现有两种改进分类算法的优缺点,针对ID3算法的取值偏向问题和现有两种改进算法在分类时间、分类精确度方面存在的不足,提出了一种新的分类属性选择方案,并利用数学知识对其进行了优化。经实验证明,优化后的方案克服了ID3算法的取值偏向问题,同时在分类时间及分类精确度方面优于ID3算法及现有两种改进的分类算法。  相似文献   

3.
谭德坤 《计算机应用研究》2010,27(12):4464-4466
针对中文文本分类问题,将其用于分类规则的抽取。为了避免微粒群算法在全局优化中陷入局部极值,利用混沌运动遍历性、随机性等特点,对标准微粒群算法进行了改进,提出了基于混沌微粒群算法的文本自动分类方法。仿真实验表明本算法对文档进行分类是一种比较可行的分类方法,分类精度高、速度快。  相似文献   

4.
介绍了一种基于动态聚类的模糊分类规则的生成方法,这种方法能决定规则数目,隶属函数的位置及形状.首先,介绍了基于超圆雏体隶属函数的模糊分类规则的基本形式;然后,介绍动态聚类算法,该算法能将每一类训练模式动态的分为成簇,对于每簇,则建立一个模糊规则;通过调整隶属函数的斜度,来提高对训练模式分类识别率,达到对模糊分类规则进行优化调整的目的;用两个典型的数据集评测了这篇文章研究的方法,这种方法构成的分类系统在识别率与多层神经网络分类器相当,但训练时间远少于多层神经网络分类器的训练时间.  相似文献   

5.
基于规则的自动分类在文本分类中的应用   总被引:8,自引:3,他引:8  
文本自动分类是指将文本按一定的策略归于一个或多个类别中的应用技术。本文首先介绍三种基于统计的自动分类技术(k近邻分类器、支持向量机分类器和朴素贝叶斯分类器),剖析了基于统计的自动分类的优势及不足。基于统计的自动分类的不足主要表现为:当类别之间分类特征的交叉变大时,分类精度呈下降趋势,在多层分类的情况下,此局限尤为突出。针对此局限性,为了提高自动分类的精度,我们引入了基于规则的自动分类来对其进行改进和扩充,并整合两种自动分类技术的优点,设计出了混合分类器系统,从而获得了比较理想的分类效果。  相似文献   

6.
为了快速有效地组织和分析海量的XML文本信息,XML文本的自动分类必不可少.文中提出了一种基于RBF神经网络的分类方法,并运用改进型的CHI统计量方法进行特征提取,对传统的加权公式进行了一些改进,再运用资源优化神经网络(RON)进行训练,做了必要的实验分析.实验结果表明该分离器有较高的分类质量,提高了分类的效率,有较高的分类准确性,满足了XML文本自动分类的要求.  相似文献   

7.
郑盼丽  戴牡红 《计算机系统应用》2012,21(11):218-221,193
研究了一种基于文法引导遗传编程(GGP)的自动数据挖掘算法.规则归纳算法是一种典型的数据分类方法.采用文法引导的遗传编程对规则归纳算法进行改进,从而提出了一种规则自动提取的算法.最后结合电视购物项目,给出了基于文法引导的遗传编程自动提取规则的实例.  相似文献   

8.
动词细分类和词性标注有些类似,它是在词性标注基础上对其中的动词进行更细致的类别标注。根据动词细分类自身的特点,提出了一种改进的隐马尔科夫模型的方法进行动词类别的自动划分,再通过与最大熵的方法进行比较,证明这种方法取得了较高的准确率。  相似文献   

9.
研究数据挖掘,优化聚类循序算法,针对提高分类的效率和准确性难题,传统聚类算法不能自动聚类的问题,为提高聚类算法的收敛速度和寻优精度,提出了一种改进的自动聚类算法,从分析基因表达式编程和k均值算法的特点出发,融合了两种算法优点,实现了在未知簇划分信息的情况下对数据集自动进行聚类分析.实践中选择k-均值算法和改进算法对聚类进行了仿真检验.结果表明,将改进的自动聚类算法应用于GIS物流选址优化中,与传统聚类算法相比,改进的算法不仅具有比较快的收敛速度和聚类精度,而且使得聚类结果更有参考价值.  相似文献   

10.
研究指纹的自动分类问题对解决大容量指纹库的匹配实时性有着重要的意义。为了优化基于指纹识别的银行隙管箱系统.提高其对指纹图像的识别速度,文中引进了遗传算法指纹分类对指纹图像进行粗匹配。该方法通过利用复制、交叉和变异操作,对群体中的个体进行优化与筛选。介绍了基于遗传算法的指纹分类在银行保管箱系统中的应用.纂于遗传算法的指纹分类法克服了一般排他性分类法所固有的对某些指纹图像无法识别的缺陷.同时提高了整个系统的效率。  相似文献   

11.
自适应共振理论能够动态地对输入向量进行聚类,概率神经网络使用联合概率密度分布进行分类估计.给出将两者结合使用的算法,并应用到入侵检测中.测试表明,概率神经网络的函数逼近能力和网络性能得到提高,入侵检测系统的漏报率和误报率明显下降.  相似文献   

12.
粗糙集理论框架下的神经网络建模研究及应用   总被引:7,自引:1,他引:7  
为协调决策支持和分类,引入了一种新的方法,该方法将粗糙集理论和神经网络有机地结合在一起,提出了一种基于粗糙集理论的神经网络模型构造方法.首先,利用粗糙集理论智能数据分析的能力,对神经网络进行预处理,抽取关键成分作为神经网络的输入,从而确定粗糙神经网络的初始拓扑结构.在此基础上,进一步研究和分析了该模型的实现步骤,并应用原始数据对网络进行训练,最后将该模型应用于分类规则的抽取.试验结果比较表明,该模型可以有效地提高分类的精度.  相似文献   

13.
一种基于粗糙集神经网络的分类算法*   总被引:1,自引:0,他引:1  
当输入维数高时神经网络结构复杂,体系庞大,导致其收敛速度慢,为克服这个缺点,提出了基于决策规则的神经网络(RDRN),利用粗糙集理论从数据样本中获取最简的决策规则,按决策规则语义构建一种不完全连接的神经网络。根据决策语义规则,计算并初始化网络的参数,减少网络训练的迭代次数,提高网络的收敛速度。同时利用蚁群算法对网络输入的连续属性的最优离散化值进行寻优,从而获得了最优的网络结构。最后通过实验结果将本文提出方法与传统神经网络方法以及支持向量机分类方法进行了比较。比较说明了该神经网络具有收敛速度较快,分类效率较高的优点。  相似文献   

14.
在脉象信号分析识别中,时域、频域等分析方法难以挖掘脉象信号的非线性信息,且传统机器学习方法需要人工定义特征,无法进行特征的自学习。提出一种基于无阈值递归图和卷积神经网络的脉象分析识别方法。基于非线性动力学理论,将脉象信号转换为无阈值递归图,通过VGG-16卷积神经网络实现递归图非线性特征的自动提取,并建立脉象分类模型。实验结果表明,该方法分类准确率可达98.14%,与已有的脉象分类方法相比有所提升。该研究为脉象信号分类提供了一种新的思路和方法,对脉诊客观化具有一定的实用价值。  相似文献   

15.
基于模糊高斯基函数神经网络的遥感图像分类   总被引:8,自引:0,他引:8       下载免费PDF全文
针对遥感图像分类的特点,提出了一种基于模糊高斯基函数神经网络的遥感图像分类器。该分类器将模糊技术与神经网络相结合,采用神经网络来实现模糊推理,利用神经网络的学习能力来达到调整模糊隶属函数和模型规则的目的,从而使系统具备了自适应的特性,实验结果表明,这种基于模糊高斯基孙数神经网络的分类器经过训练后,可应用于遥感图像的分类,其分类精度明显高于传统的最大似然分类法。  相似文献   

16.
一个基于模糊神经网络的模式分类系统   总被引:9,自引:0,他引:9  
目前,基于神经网络的分类系统在许多领域得到了越来越广泛的应用。但是,该系统大多采用的是离线自适应机制,即神经网络需学习新的分类知识时,要重新训练神经网络,从而大大增加神经网络的训练时间;对于重叠分类,一般是构成一个贝叶斯分类器。然而,贝叶斯分类器的构成需要关于分类数据的概率密度函数的先验知识,而这些知识常常在模式分类前是难以获得的。为了解决这些问题,文中根据模糊集合理论,提出了一种基于模糊神经网络  相似文献   

17.
本文提出了一种将粗糙集理论作为神经网络的预处理系统、两者共同构成一个分类系统的分类模型。利用粗糙集方法删除冗余属性、简化训练数据集,从而减小神经网络构成系统的复杂性,也减小网络训练时间;用神经网络作为后置的分类系统,可以提高整个系统的容错和抗干扰能力。  相似文献   

18.
粗糙集和神经网络方法在数据挖掘中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
提出了一种基于神经网络和粗集的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。  相似文献   

19.
人工神经网络遥感分类方法研究现状及发展趋势探析   总被引:12,自引:1,他引:12  
从人工神经网络技术本身出发,概括了其在遥感分类中的研究现状,分析了人工神经网络遥感分类方法与其它分类方法相比具有的优势,介绍了人工神经网络遥感分类的一些主要应用,并进一步对人工神经网络遥感分类方法的发展趋势进行了展望。  相似文献   

20.
关系分类是自然语言处理领域的一项重要语义处理任务。传统的关系分类方法通过人工设计各类特征以及各类核函数来对句子内部2个实体之间的关系进行判断。近年来,关系分类方法的主要工作集中于通过各类神经网络获取句子的语义特征表示来进行分类,以减少手动构造各类特征。在句子中,不同关键词对关系分类任务的贡献程度是不同的,然而重要的词义有可能出现在句子中的任意位置。为此,提出了一种基于注意力的混合神经网络关系分类模型来捕获重要的语义信息,用来进行关系分类,该方法是一种端到端的方法。实验结果表明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号