期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陶晓玲韦毅王勇《电子科技大学学报(自然科学版)》2016,45(3):417-422

海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。相似文献

2.

一种基于决策的数据补全方法 总被引：1，自引：0，他引：1

傅媛《昆明理工大学学报(自然科学版)》2003,28(6):157-160

一般来说，在从数据库中获得有用的知识之前，通过采样，收集而取得的原始数据不一定适合于直接运用于知识获取，通常要对原始数据进行加工处理，对有遗漏的信息资料就要补全，文章在对粗糙集理论研究的基础上，运用容差关系对含有决策的数据表进行了遗漏补缺，实例表明此方法是行之有效的。相似文献

3.

一种不确定数据的朴素贝叶斯分类方法

熊小峰李文进毛伊敏《南方冶金学院学报》2014,(5):96-100

针对不确定性数据的分类问题,提出一种基于直方图估计的不确定性朴素贝叶斯分类器(HU-NBC).基于直方图估计的思想,建立估计不确定性数据概率密度函数的数学模型,并利用该模型估计不确定性朴素贝叶斯分类器的类条件概率密度函数.实验结果表明,与同类型算法相比,基于直方图估计的HU-NBC算法拥有较优的分类精度、较小的时间代价和空间需求,适合解决数据量较大的不确定性数据分类问题. 相似文献

4.

一种多属性和准则定序分类模型

朱颢东钟勇《哈尔滨工业大学学报》2010,42(3):500-504

针对经典粗糙集理论在解决定性属性、定量属性以及准则属性同时出现的定序分类问题时能力较弱的这种情况,对经典粗糙集理论进行扩展,并给出了一个基于扩展粗糙集的决策分析方法.该方法使用"不可区分-相似-优势"关系来代替经典粗糙集理论中的不可区分关系来获取知识的粗糙近似.实例验证表明该方法不但能够解决上述问题而且还能处理决策表中可能存在的不一致现象,具有较好的有效性与优越性. 相似文献

5.

分类、分级模型与GIS集成的探讨

黄会平张岑《华北水利水电学院学报》2007,28(3):72-74

为了更好地实现数据的可视化,利用现有分类、分级模型和G IS的集成方法,采用M apInfo6.5和M ap-Basic作为开发环境,SPSS的图表制作功能判断数据分布特征,VC++实现分类、分级模型.G IS与分类、分级模型的集成使用户通过简单的操作即可得到统计数据的分类、分级方案,达到了辅助用户更好地实现数据可视化的功能. 相似文献

6.

一种基于相似度概率的不确定分类数据聚类算法 总被引：1，自引：1，他引：0

张新猛蒋盛益《山东大学学报(工学版)》2011,41(3):12-16

针对不确定分类数据,基于Squeezer算法提出一种有效的不确定数据聚类算法:USqueezer算法。该算法先计算一个不确定分类数据与每个簇的相似度概率和,选取最大的相似度和给定的阈值相比较,若大于阈值,将不确定数据划分到该簇中,否则创建一个新簇。实验表明,USqueezer算法能够有效地进行不确定分类数据的聚类,并且占用较少的运行内存空间和运行时间。相似文献

7.

基于深度学习的不均衡网络数据分类技术研究

下载免费PDF全文

李青赵唱鞠永慧何鑫泰张健《信息工程大学学报》2021,22(2):215-221

在现实网络环境中,数据分布不均衡是普遍现象,也是研究的热点问题.利用传统机器学习算法解决该问题的研究成果较多,综述性研究也较丰富.但当前从深度学习的角度探讨数据不均衡问题已成为新趋势.对此,综述了基于深度学习方法的研究成果.通过对数据不均衡问题进行深入分析,从数据预处理、分类器设计及改进两大方面梳理相关技术路线,包括传... 相似文献

8.

基于流形学习的基因微阵列数据分类方法

李强石陆魁刘恩海王歌《郑州大学学报(工学版)》2012,33(5):121-124

提出了一种结合流形学习方法与分类算法的基因微阵列数据分类模型,先用流形学习算法对基因微阵列数据进行降维处理,然后再对降维后的数据进行分类.在实验中将流形学习算法LLE、ISO-MAP、LE和LTSA与三种分类算法相结合,并与直接用高维数据进行分类的结果进行了比较,实验结果表明所提出的模型极大地提高了分类精度,同时也提高了分类算法的执行效率. 相似文献

9.

一种基于遗传算法的分类方法

石先军《武汉纺织工学院学报》2003,16(3):32-34

数据挖据的目的是从数据库中获取知识。本文针对挖据目的，提出了一种基于遗传算法的分类方法，并应用于实例，得到了很好的结果。相似文献

10.

一种多属性约简支持向量机混合分类方法

李波郭凤菊李新军《昆明理工大学学报(自然科学版)》2006,31(4):113-117

针对属性特别多仅用一种属性约简方法难以实现有效约简的情况,提出了基于双重属性约简的混合支持向量机分类方法.通过引入贡献率和正确率两个概念,首先采用主成分分析算法计算各个条件属性的贡献率,根据贡献率大小和给定的阈值去掉条件属性中贡献率小的成分,提取信息量最大的主要成分;然后再基于粗糙集的属性约简理论,计算这些主要成分对决策变量的正确率,对这些属性进行第二次约简;该方法采用定性定量相结合的方式,可以最大程度地去除属性集中冗余的或不重要的属性,保证将最简的属性样本集输入支持向量机进行建模预测.最后的仿真试验验证了我们所提方法的有效性和正确性. 相似文献

11.

基于Rough Set和neural network组合数据挖掘

下载免费PDF全文

王志明《湖南工业大学学报》2007,21(2):79-83

提出了一种基于rough set和neural network的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简，然后使用神经网络对数据进行学习，并同时完成属性的不一致约简，最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明，该方法快速有效，生成规则简单准确，具有良好的鲁棒性。相似文献

12.

基于矩阵的决策表属性值分类方法

汪小燕《安徽工业大学学报》2007,24(4):424-426

在粗糙集值约简算法中,需要对决策表的属性值进行分类.文中基于二进制可辨矩阵和为同一决策类的不同对象建立的二进制矩阵,提出一种简化的属性值分类方法,该方法能实现决策表属性值快速分类.最后通过实例分析验证了该方法的可行性和有效性. 相似文献

13.

粗糙集在数据挖掘分类规则中的应用研究 总被引：5，自引：0，他引：5

张文宇薛惠锋张洪才彭文祥《西北工业大学学报》2002,20(3):430-434

数据集中的冗余性会降低数据挖掘结果的解释能力和精度，介绍了数据集中挖掘分类规则的基本原则，并利用粗糙集理论中核及决策类覆盖的概念，提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系，并简化带有不同相容规则的决策系统的数据挖掘算法，并应用一简单的例子说明如何在数据库中发现分类规则。相似文献

14.

一种动态调整训练集的中文文本分类系统

欧阳勇马忠宝《湖北工业大学学报》2009,24(5):57-60

对文本特征表示模型和文本特征提取方法进行了探讨,分析了分类效果的影响因素,设计了一种动态调整训练集的文本分类算法,并结合支持向量机验证了该分类系统的类别特征信息和分类适应性. 相似文献

15.

基于本体的数据信息融合模型的研究

陈飞杨秋红《安徽电子信息职业技术学院学报》2015,(2):28-30,40

本文提出了一种基于本体的数据信息融合的模型,该模型以数据源为基础,以用户应用为目的,通过本体和数据仓库技术进行实现,本文主要介绍该模型的组成和实现原理。相似文献

16.

基于粗集理论缺省数据的改进算法

王清晖刘文奇《昆明理工大学学报(自然科学版)》2004,29(2):148-150

在对粗集理论研究的基础上，利用对象间的属性值差异引入粗糙相似度的概念，提出一种改进的ROUSTIDA算法，指出改进后的算法使更多的数据得到科学的补齐．实例表明此方法是比较有效的．相似文献

17.

商业数据挖掘中的核心算法

王瑞鑫刘万春《北京工业大学学报》2004,30(4):510-514

为了使企业的管理层能够根据市场需求进行数据挖掘,并基于挖掘出来的规则做出决策,在数据仓库、粗糙集方法等理论的基础上提出了一种核心算法,应用于商业数据挖掘.核心算法从信息表开始,通过属性泛化、求核心属性、属性归约,最终得到由正确率表示的规则.在求核心属性的部分对粗糙集理论中求核心集的方法进行了改进,并给出了相应的证明.核心算法利用SQL语言的功能强大、容易开发、运行稳定等特点,通过SQL语言编程来实现.核心算法具有针对性强、可操作性强等优点. 相似文献

18.

基于粗糙集的数据挖掘技术在电子商务中的应用

王萍《南京工业职业技术学院学报》2011,11(4):55-57

描述了粗糙集理论的基本思想,并给出了粗糙集在电子商务网站中针对客户数据库的数据挖掘方法,最后通过实例说明了这一数据挖掘模型的有效性。相似文献

19.

基于粗糙集的生产环境数据挖掘系统方法

刘发升毛林春《南方冶金学院学报》2005,26(3):16-20

针对粗糙集确定性模型缺乏处理不确定信息的特点，Z．Pawlak等提出了粗糙集的概率模型，但该模型没有包括如何处理生产数据集纷繁复杂数据的方法，因此提出了应用粗糙集于生产环境数据挖掘的一种系统方法，并应用UCI的数据集对该方法进行了检验，实验结果体现了它的性能与有效性。相似文献