首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
一种基于本体的并行网络流量分类方法   总被引:1,自引:0,他引:1  
海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。  相似文献   

2.
一种基于决策的数据补全方法   总被引:1,自引:0,他引:1  
一般来说,在从数据库中获得有用的知识之前,通过采样,收集而取得的原始数据不一定适合于直接运用于知识获取,通常要对原始数据进行加工处理,对有遗漏的信息资料就要补全,文章在对粗糙集理论研究的基础上,运用容差关系对含有决策的数据表进行了遗漏补缺,实例表明此方法是行之有效的。  相似文献   

3.
针对不确定性数据的分类问题,提出一种基于直方图估计的不确定性朴素贝叶斯分类器(HU-NBC).基于直方图估计的思想,建立估计不确定性数据概率密度函数的数学模型,并利用该模型估计不确定性朴素贝叶斯分类器的类条件概率密度函数.实验结果表明,与同类型算法相比,基于直方图估计的HU-NBC算法拥有较优的分类精度、较小的时间代价和空间需求,适合解决数据量较大的不确定性数据分类问题.  相似文献   

4.
针对经典粗糙集理论在解决定性属性、定量属性以及准则属性同时出现的定序分类问题时能力较弱的这种情况,对经典粗糙集理论进行扩展,并给出了一个基于扩展粗糙集的决策分析方法.该方法使用"不可区分-相似-优势"关系来代替经典粗糙集理论中的不可区分关系来获取知识的粗糙近似.实例验证表明该方法不但能够解决上述问题而且还能处理决策表中可能存在的不一致现象,具有较好的有效性与优越性.  相似文献   

5.
为了更好地实现数据的可视化,利用现有分类、分级模型和G IS的集成方法,采用M apInfo6.5和M ap-Basic作为开发环境,SPSS的图表制作功能判断数据分布特征,VC++实现分类、分级模型.G IS与分类、分级模型的集成使用户通过简单的操作即可得到统计数据的分类、分级方案,达到了辅助用户更好地实现数据可视化的功能.  相似文献   

6.
一种基于相似度概率的不确定分类数据聚类算法   总被引:1,自引:1,他引:0  
针对不确定分类数据,基于Squeezer算法提出一种有效的不确定数据聚类算法:USqueezer算法。该算法先计算一个不确定分类数据与每个簇的相似度概率和,选取最大的相似度和给定的阈值相比较,若大于阈值,将不确定数据划分到该簇中,否则创建一个新簇。实验表明,USqueezer算法能够有效地进行不确定分类数据的聚类,并且占用较少的运行内存空间和运行时间。  相似文献   

7.
在现实网络环境中,数据分布不均衡是普遍现象,也是研究的热点问题.利用传统机器学习算法解决该问题的研究成果较多,综述性研究也较丰富.但当前从深度学习的角度探讨数据不均衡问题已成为新趋势.对此,综述了基于深度学习方法的研究成果.通过对数据不均衡问题进行深入分析,从数据预处理、分类器设计及改进两大方面梳理相关技术路线,包括传...  相似文献   

8.
提出了一种结合流形学习方法与分类算法的基因微阵列数据分类模型,先用流形学习算法对基因微阵列数据进行降维处理,然后再对降维后的数据进行分类.在实验中将流形学习算法LLE、ISO-MAP、LE和LTSA与三种分类算法相结合,并与直接用高维数据进行分类的结果进行了比较,实验结果表明所提出的模型极大地提高了分类精度,同时也提高了分类算法的执行效率.  相似文献   

9.
数据挖据的目的是从数据库中获取知识。本文针对挖据目的,提出了一种基于遗传算法的分类方法,并应用于实例,得到了很好的结果。  相似文献   

10.
针对属性特别多仅用一种属性约简方法难以实现有效约简的情况,提出了基于双重属性约简的混合支持向量机分类方法.通过引入贡献率和正确率两个概念,首先采用主成分分析算法计算各个条件属性的贡献率,根据贡献率大小和给定的阈值去掉条件属性中贡献率小的成分,提取信息量最大的主要成分;然后再基于粗糙集的属性约简理论,计算这些主要成分对决策变量的正确率,对这些属性进行第二次约简;该方法采用定性定量相结合的方式,可以最大程度地去除属性集中冗余的或不重要的属性,保证将最简的属性样本集输入支持向量机进行建模预测.最后的仿真试验验证了我们所提方法的有效性和正确性.  相似文献   

11.
提出了一种基于rough set和neural network的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。  相似文献   

12.
在粗糙集值约简算法中,需要对决策表的属性值进行分类.文中基于二进制可辨矩阵和为同一决策类的不同对象建立的二进制矩阵,提出一种简化的属性值分类方法,该方法能实现决策表属性值快速分类.最后通过实例分析验证了该方法的可行性和有效性.  相似文献   

13.
粗糙集在数据挖掘分类规则中的应用研究   总被引:5,自引:0,他引:5  
数据集中的冗余性会降低数据挖掘结果的解释能力和精度,介绍了数据集中挖掘分类规则的基本原则,并利用粗糙集理论中核及决策类覆盖的概念,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,并简化带有不同相容规则的决策系统的数据挖掘算法,并应用一简单的例子说明如何在数据库中发现分类规则。  相似文献   

14.
对文本特征表示模型和文本特征提取方法进行了探讨,分析了分类效果的影响因素,设计了一种动态调整训练集的文本分类算法,并结合支持向量机验证了该分类系统的类别特征信息和分类适应性.  相似文献   

15.
本文提出了一种基于本体的数据信息融合的模型,该模型以数据源为基础,以用户应用为目的,通过本体和数据仓库技术进行实现,本文主要介绍该模型的组成和实现原理。  相似文献   

16.
在对粗集理论研究的基础上,利用对象间的属性值差异引入粗糙相似度的概念,提出一种改进的ROUSTIDA算法,指出改进后的算法使更多的数据得到科学的补齐.实例表明此方法是比较有效的.  相似文献   

17.
为了使企业的管理层能够根据市场需求进行数据挖掘,并基于挖掘出来的规则做出决策,在数据仓库、粗糙集方法等理论的基础上提出了一种核心算法,应用于商业数据挖掘.核心算法从信息表开始,通过属性泛化、求核心属性、属性归约,最终得到由正确率表示的规则.在求核心属性的部分对粗糙集理论中求核心集的方法进行了改进,并给出了相应的证明.核心算法利用SQL语言的功能强大、容易开发、运行稳定等特点,通过SQL语言编程来实现.核心算法具有针对性强、可操作性强等优点.  相似文献   

18.
描述了粗糙集理论的基本思想,并给出了粗糙集在电子商务网站中针对客户数据库的数据挖掘方法,最后通过实例说明了这一数据挖掘模型的有效性。  相似文献   

19.
针对粗糙集确定性模型缺乏处理不确定信息的特点,Z.Pawlak等提出了粗糙集的概率模型,但该模型没有包括如何处理生产数据集纷繁复杂数据的方法,因此提出了应用粗糙集于生产环境数据挖掘的一种系统方法,并应用UCI的数据集对该方法进行了检验,实验结果体现了它的性能与有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号