首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
空间分类数据同位规则挖掘算法   总被引:3,自引:0,他引:3  
针对空间分类数据的特性,提出一种空间分类数据同位规则挖掘算法.利用空间关系定义数据挖掘中事务的概念,采用多层参与索引搜索空间同位规则,从而实现了对空间分类数据的有效处理.采用文中算法对杭州地区119火灾数据进行实验,并验证了该算法的适用范围和性能.实验表明,该算法可以有效地处理经过离散化后的连续数据.  相似文献   

2.
无重叠子空间分类聚类算法   总被引:1,自引:0,他引:1  
传统的聚类算法主要是对数值型的数据进行聚类,而随着对数据的发展需求,建立在分类数据上的算法也越来越多,由于分类数据没有直接意义上的距离,传统算法不能解决这个问题.同时,现有子空间上的分类聚类研究不是很多.引用熵的概念来选择确定划分的类别和类的最优中心点,同时提出了一种新的目标函数来得到每个类上的相关子空间集,并根据目标函数的最小值来优化聚类的划分.实验结果表明,该方法是可行的,同时也能够了解每个类中的数据结构特点.  相似文献   

3.
一种可伸缩的空间决策树分类挖掘算法   总被引:1,自引:0,他引:1  
提出了一个伸缩性好的空间决策树分类算法,在分类时既考虑待分类对象的非空间属性,又考虑其空间邻接对象的属性对其分类的影响。该算法没有训练数据库需存储于内存的限制,对训练库也没有记录个数及属性个数的限制,能生成简练、精确的决策树。  相似文献   

4.
在数据挖掘领域,分类获得了很大的关注度,其主要目的是预测数据对象的所属类别。分类方法可分为基于规则和不基于规则两大类,其中神经网络由于在预测、从经验中学习、从先前样本中泛化等方面的优秀表现,使其成为分类领域的一个重要的方法,并往往能够获得很高的分类准确性,然而其非常有限的解释能力成为了制约其应用的一大缺陷。提出了一种基于改良蚁群算法的神经网络分类规则提取方法,通过改良的蚁群算法来填补神经网络有限的解释能力,从数据中提取出分类规则。实验证明,该方法能够很好的辅助神经网络,从要分类的数据中获取规则。  相似文献   

5.
李雪婵 《计算机科学》2008,35(6):299-300
本文对目前比较优秀的各种分类方法进行了介绍、分析和比较.在此基础上,借鉴决策树方法的快速分类特性,提出了一种基于数据库抽样的海量数据分类算法,给出了算法的设计思想和实现原理,并对多处理环境下的优化进行了探讨.实验研究表明,该算法可以明显提高海量数据库的分类效率.  相似文献   

6.
在机器学习及其分类问题时经常会遇到非平衡数据集,为了提高非平衡数据集分类的有效性,提出了基于商空间理论的过采样分类算法,即QMSVM算法。对训练集中多数类样本进行聚类结构划分,所得划分结果和少数类样本合并进行线性支持向量机(SVM)学习,从而获取多数类样本的支持向量和错分的样本粒;另一方面,获取少数类样本的支持向量和错分的样本,进行SMOTE采样,最后把上述得到的两类样本合并进行SVM学习,这样来实现学习数据集的再平衡处理,从而得到更加合理的分类超平面。实验结果表明,和其他几种算法相比,所提算法虽在正确分类率上有所降低,但较大改善了g_means值和acc+值,且对非平衡率较大的数据集效果会更好。  相似文献   

7.
在实际应用中,容易获取大量的未标记样本数据,而样本数据是有限的,因此,半监督分类算法成为研究者关注的热点.文中在协同训练Tri-Training算法的基础上,提出了采用两个不同的训练分类器的Simple-Tri-Training方法和对标记数据进行编辑的Edit-Tri-Training方法,给出了这三种分类方法与监督分类SVM的分类实验结果的比较和分析.实验表明,无标记数据的引入,在一定程度上提高了分类的性能;初始训练集和分类器的选取以及标记过程中数据编辑技术,都是影响半监督分类稳定性和性能的关键点.  相似文献   

8.
基于空间分割的数据简化和分类   总被引:1,自引:1,他引:1  
数据简化的目的是简化数据集并保留有用的分类结构 .本文提出一个基于空间分隔的数据简化和分类算法 ,该算法将常规数据库的记录映射到多维空间上 ,从而将数据简化过程转变成在多维空间中同类数据的空间合并问题 ,也就是多维空间中不同类数据的空间分隔问题 ,最终得到一系列分隔空间 ,达到数据简化和分类的作用 .该方法用现实世界的 7个数据集进行评估 ,并与 C4.5所获得的结果进行比较 ,效果是显著的 ,并且结果唯一  相似文献   

9.
10.
刘臻  鲁学亮  WU Jun 《计算机应用》2011,31(Z1):112-115
传统的行为模式分类一般是基于问卷调查的方式来实现,但存在数据的可靠性和采集的困难等问题。提出一种基于GPS记录数据建立人的三种行为模式的分类方法,通过时间、速度和方向等参数建立人的静止、步行和驱车三种模式,并根据GPS记录点集的空间分布特征以及邻域分析方法建立GPS误差消除模型和路径的跟踪模型。  相似文献   

11.
提出了基于分布估计算法的模糊分类建模方法,该方法基于Apriori原理生成初始模糊规则集,并且以匹茨堡型的二进制编码方式对模糊规则集编码,基于双变量相关的MIMIC (mutual information maximization for input clustering)分布估计算法从初始规则集中自动抽取模糊规则.通过在Iris,Pima,Wine这3个标准数据集的仿真实验表明,该方法比基于遗传算法的模糊分类器在准确率和解释性方面更有效.  相似文献   

12.
为了将神经网络应用于城区激光雷达点云数据分类,并针对大规模点云数据训练过程中计算量大、耗时长的问题,改进原有PointNet神经网络,加入了点云邻域特征的提取和分析,提出了一种新的点云分类算法。通过网格化聚类和重采样压缩原始点云数据量,提取多尺度邻域点云数据,利用改进PointNet完成对城区点云数据的分类,并用不同地区数据验证该分类算法。结果表明该算法分类效果良好,分类精度较高;数据训练过程中的计算量减少;能够对城区机载激光雷达数据实现有效分类。  相似文献   

13.
基于商空间粒度理论的大规模SVM分类算法   总被引:3,自引:1,他引:3  
利用商空间粒度理论对已有的SVM分类算法进行改进,给出了一种新的SVM分类算法——SVMG。该算法将SVM分类问题划分成两个或多个子问题,从而降低了SVM分类复杂度。实验表明,改进的算法适用于处理大数据量的样本,能在保持分类精度的情况下有效地提高支持向量机的学习和分类速度。  相似文献   

14.
客户关系管理以客户为中心,通过再造企业组织体系和优化业务流程,展开系统的客户研究,最大程度地改善、提高了整个客户关系生命周期的绩效,从而提高客户的满意度和忠诚度,提高运营效率和利润收益。该文研究和探讨了客户关系管理系统开发的技术环节及实现过程,并对基于贝叶斯分类算法的客户流失分析模型的建立进行了分析。  相似文献   

15.
基于核空间相对密度的SVDD多类分类算法*   总被引:3,自引:0,他引:3  
针对现有基于支持向量数据描述(SVDD)的多类分类算法未能充分利用重叠区域样本分布信息等问题,提出了一种基于核空间相对密度的SVDD多类分类算法DM-SVDD。该算法首先由SVDD确定包围每类数据的最小超球,然后计算位于最小超球重叠区域中每个样本在其同类样本间的相对密度,最后以各类样本相对密度的均值为标准,对重叠区域内的待测样本进行分类。实验结果表明,算法DM-SVDD是可行有效的。  相似文献   

16.
代价敏感分类区别于一般分类方法,更关注高代价类别的分类准确性而容忍全局分类的准确性。三支决策作为一种代价敏感分类问题的解决思路,缺乏对序列数据的支持。结合LSTM模型处理序列数据的能力,提出一种使用三支决策(3WD)改进的序列数据分类方法。方法经过LSTM网络对原数据进行粗分类;对分类结果进行整体代价评估;最终,对高风险分类进行延迟或拒绝处理。方法在4个数据集上进行了测试,并进行了2组对比实验。实验结果表明:本文方法在不改变LSTM模型的情况下,对LSTM模型的分类结果进行了代价区分。  相似文献   

17.
随着网络传输速率的不断提高,分布式报文分类算法以其快速高效的特点越来越受到业界的关注,但却普遍存在内存消耗过高的问题。针对这一问题提出了基于域冲突空间的多标签树算法(MLT-FCS),将各域规则划分为不同的冲突区,并为冲突区和区内元素分配各自的标签,然后在此基础上设计出两级查询机制以减少待查规则的数目,充分利用硬件的并行处理和流水线操作特性,提出了第二级查询的多标签树算法。分析及仿真表明,MLT-FCS在实现高速分类(OC-192)的同时减少了存储开销,并为规则库规模的扩展和规则维数的扩展提供了较好的支  相似文献   

18.
刘华富  张文生 《计算机工程与设计》2007,28(17):4065-4067,4115
使用支持向量机算法直接求海量数据的模糊分类系统是相当困难的.为了解决这个问题,提出了基于邻域原理设计模糊分类系统的方法.将支持向量机的理论建立在距离空间上,设计出了计算支持向量的邻域算法;利用所求的支持向量,基于平分最近点方法设计出了求分类超平面的算法,求出模糊分类系统,该算法优于基于支持向量机直接求模糊分类系统的方法.实验结果说明,该方法可有效地解决对海量数据的模糊分类系统的设计问题.  相似文献   

19.
针对标准遗传算法的不稳定性、准确性低等问题,为了提高遗传分类算法的稳定性和准确性,基于贝叶斯算法的有关理论,提出一种新的遗传算法分类方法.将初始样本集随机的分成数量相等的几组,通过朴素贝叶斯算法从初始样本集中选出部分“区分度”比较高的样本作为新的样本集,通过改进的遗传算法对选出的新样本集进行处理,从而得到最优分类规则.通过两种算法的组合对数据分类时,使分类的稳定性和准确性得到了明显的改善.仿真实验结果表明,该算法有较高的稳定性和准确性.  相似文献   

20.
空间故障树与因素空间融合的智能可靠性分析方法   总被引:1,自引:0,他引:1       下载免费PDF全文
崔铁军    汪培庄 《智能系统学报》2019,14(5):853-864
现有系统可靠性分析方法一般具有针对性,缺乏广泛的适应性和扩展性。由于智能科学、信息科学和大数据技术的涌现和发展,使得传统可靠性分析技术难以适应新的需要。因此作者提出了空间故障树理论,目的是分析多因素影响下的系统可靠性变化特征。将空间故障树理论与因素空间理论、云模型、模糊数学及系统稳定性等相结合,使其具有智能分析和故障大数据处理能力,以满足未来技术环境下的分析要求。本文论述了空间故障树和因素空间的发展史及主要理论与功能;以及两种理论结合,描述和分析系统演化过程的可行性。研究表明,空间故障树理论具有良好的扩展性和适应性,可适应未来技术环境,也可作为系统演化过程分析的普适框架。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号