首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
基于相似粗集理论模型,对加权朴素Bayes算法进行了扩展,同时改进了传统不完备信息系统中缺失信息的弥补方法,并由此提出了基于不完备信息系统的加权Bayes分类算法,阐述了其对于不完备系统数据挖掘的重要意义,通过计算机仿真实验验证了该方法的有效性。  相似文献   

2.
不完备信息系统中的集对粗糙集模型分析   总被引:1,自引:0,他引:1       下载免费PDF全文
考虑一种不完备信息系统,其中同时具有缺席和遗漏型未知属性值,在这种不完备信息系统中,采用集对分析的方法构建了一种新的基于联系度的加权相似度量。在此基础上,分析了加权相似度量在两种特殊情形的不完备信息系统中的表现形式,并通过实例说明了它的有效性。  相似文献   

3.
一种不完备信息系统的属性约简算法研究   总被引:2,自引:0,他引:2  
通过分析不完备信息系统的粗糙集模型,引入了一种基于约束相似关系的二进制可辨矩阵的构造方法,该方法不仅适用于一致性的不完备信息系统,也适用于不一致性的不完备信息系统,并提出了一种基于下近似二进制可辨矩阵直接求取不完备信息系统的属性核和属性约简的算法,实验表明算法简单有效。  相似文献   

4.
现实中的信息系统往往是不完备的。处理不完备信息系统的一种常用方法是根据一定的规则对缺失的属性值予以赋值,从而将其补齐成完备的信息系统。文中提出了一种基于绝对信息量的赋值规则,根据该规则提出了补齐不完备信息系统的算法。该算法基于信息系统的内在性质,减少了数据补齐时人为引入的不确定性,因而更加合理、有效。  相似文献   

5.
在不完备信息系统和模糊决策信息系统的基础上,提出一种基于相容关系的不完备模糊决策信息系统的粗糙集模型,并重新定义了不完备模糊决策信息系统上任意子集的上下近似,给出了基于属性依赖度的启发式知识约简算法,通过实例验证了算法的可行性.  相似文献   

6.
高效的不完备信息系统知识约简算法研究   总被引:3,自引:0,他引:3  
文章基于粒度和粒度计算的方法,对不完备信息系统的属性重要度和相对于决策属性的重要度做了定义,在此基础上形成了基于粒度方法的不完备信息系统知识约简算法,通过实例证明了这种方法的有效性。文章分析了算法的时间复杂度,并同粗糙集算法进行了对比。  相似文献   

7.
基于集合覆盖的不完备信息系统属性约简方法   总被引:2,自引:0,他引:2  
深入分析了不完备信息系统的特点以及相似关系的定义,通过构造不完备信息系统的相关矩阵,把不完备信息系统的最小属性约简问题与最小集合覆盖问题联系起来,将不完备信息系统的最小属性约简问题转化为最小集合覆盖问题,给出了基于集合覆盖的不完备信息系统最小属性约简算法。实例分析证明该算法可行,高效。  相似文献   

8.
不完备信息系统的一种属性相对约简算法   总被引:6,自引:0,他引:6       下载免费PDF全文
张腾飞  王锡淮  肖健梅 《计算机工程》2007,33(9):184-185,198
经典粗糙集理论是建立在完备信息基础上的,然而现实中,由于各种原因,很多的信息系统是不完备的。该文分析了不完备信息系统下的粗糙集模型,引入了一种构造广义决策表的方法,提出了一种基于广义决策表直接求取不完备信息系统属性相对约简的算法。通过实例计算,说明了算法的简单性和有效性。  相似文献   

9.
网络谣言可能扰乱人们的思想、心理和行为,引发社会震荡、危害公共安全,而微博等社交平台的广泛应用使得谣言造成的影响与危害变得更大,因此,谣言检测对于网络空间的有序健康发展具有重要的意义。当前谣言的自动检测技术更多关注检测模型的构建和输入数据的表现形式,而在改善数据质量以提高谣言识别效果方面的研究很少。基于此,本文将粗糙集理论应用于不完备谣言信息系统进行知识获取与决策,实质上是通过粗糙集理论解决不完备谣言信息系统的不确定性度量,冗余性以及不完备性等问题,以获得高质量的数据,改善谣言检测效果。首先系统总结了粗糙集理论中不确定性度量的方法,包括香农熵、粗糙熵、Liang熵以及信息粒度等四种不确定度量方法,并整理和推导了这四种不确定度量方法从完备信息系统到不完备信息系统的一致性拓展。基于上述总结的四种不确定度量方法,提出了基于最大相关最小冗余(MCMR,Maximum CorrelationMinimum Redundancy)的知识约简算法。该方法基于熵度量方式,能够综合考量决策信息与冗余噪音,在UCI及Weibo等8个数据集上实验验证,结果表明本文算法优于几种基线算法,能够有效解决信息系统的冗余性。另外,提出了一种基于极大相容块的不完备决策树算法,在不同缺失程度数据上实验验证,结果表明本文算法能够有效解决信息系统的不完备性。  相似文献   

10.
针对不完备信息系统,提出一种基于信息量属性约简的新方法.该方法对传统的容差关系计算方法进行了改进,并在此基础之上给出了一种新的求核属性的方法.通过判断可以直接得到核属性,这样在计算的过程中大大的降低了属性约简算法的时间复杂度.最后设计了一个新的基于不完备信息系统信息量属性约简算法,通过实例验证了该算法的正确性、高效性.  相似文献   

11.
针对Android平台恶意应用的检测技术,提出一种基于集成学习投票算法的Android恶意程序检测方法MASV(Soft-Voting Algorithm),以有效地对未知应用程序进行分类。从已知开源的数据集中获取了实验的基础数据,使用的应用程序集包含213 256个良性应用程序以及18 363个恶意应用程序。使用SVM-RFE特征选择算法对特征进行降维。使用多个分类器的集合,即SVM(Support Vector Machine)、[K]-NN[(K]-Nearest Neighbor)、NB(Na?ve Bayes)、CART(Classification and Regression Tree)和RF(Random Forest),以检测恶意应用程序和良性应用程序。使用梯度上升算法确定集成学习软投票的基分类器权重参数。实验结果表明,该方法在恶意应用程序检测中达到了99.27%的准确率。  相似文献   

12.
为提高分布式多媒体服务组合系统中路径的健壮性和可靠性,提出一种基于Markov链和加权朴素贝叶斯分类器(WNBC)的异常预测算法。该算法利用Markov模型预测系统节点的资源状态信息,使用WNBC对预测的节点状态进行分类,以判断节点是否可能发生异常。实验结果表明,该算法能根据节点的状态信息预测系统节点的不同异常状态,性能较同类算法有较大的改善。  相似文献   

13.
常捷  张灵  曾碧 《传感技术学报》2016,29(2):264-270
针对Sink节点移动所带来的时延问题,提出了一种基于最优路径的移动Sink数据收集方案OPDG(Data Gathering Based on Optimal-Path)。首先由MWHA(Minimum Weighted Heuristic Algorithm)算法得到汇聚节点RP(Rendezvous Point)的集合,然后根据这些RP节点求出移动Sink的最佳驻留点集合,最后求出经过驻留点的最短路径。Sink沿着这条路径周期性采集数据。通过NS-2中大量的仿真实验结果表明,与已有算法相比,OPDG算法能最大限度的减小时延,延长网络的生命周期。  相似文献   

14.
传统集成分类算法中,一般将集成数目设置为固定值,这可能会导致较低分类准确率。针对这一问题,提出了准确率爬坡集成分类算法(C-ECA)。首先,该算法不再用一些基分类器去替换相同数量的表现最差的基分类器,而是基于准确率对基分类器进行更新,然后确定最佳集成数目。其次,在C-ECA的基础上提出了基于爬坡的动态加权集成分类算法(C-DWECA)。该算法提出了一个加权函数,其在具有不同特征的数据流上训练基分类器时,可以获得基分类器的最佳权值,从而提升集成分类器的性能。最后,为了能更早地检测到概念漂移并提高最终精度,采用了快速霍夫丁漂移检测方法(FHDDM)。实验结果表明C-DWECA的准确率最高可达到97.44%,并且该算法的平均准确率比自适应多样性的在线增强(ADOB)算法提升了40%左右,也优于杠杆装袋(LevBag)、自适应随机森林(ARF)等其他对比算法。  相似文献   

15.
本文针对垃圾邮件过滤问题,结合中文自身的特点,把广泛适用于英文文本和邮件分类的朴素贝叶斯过滤方法应用在垃圾邮件网关邮件过滤层;把信息增益修剪方法经过改进作为中文特征选择方法,应用在数据管理层;从而极大提高了垃圾邮件的过滤精度。  相似文献   

16.
王轩  张林  高磊  蒋昊坤 《计算机应用》2018,38(10):2772-2777
为应对抽样不均匀带来的影响,以基于代表的分类算法为基础,提出一种用于符号型数据分类的留一法集成学习分类算法(LOOELCA)。首先采用留一法获得n个小训练集,其中n为初始训练集大小。然后使用每个训练集构建独立的基于代表的分类器,并标注出分类错误的分类器及对象。最后,标注分类器和原始分类器形成委员会并对测试集对象进行分类。如委员会表决一致,则直接给该测试对象贴上类标签;否则,基于k最近邻(kNN)算法并利用标注对象对测试对象分类。在UCI标准数据集上的实验结果表明,LOOELCA与基于代表的粗糙集覆盖分类(RBC-CBNRS)算法相比,精度平均提升0.35~2.76个百分点,LOOELCA与ID3、J48、Naïve Bayes、OneR等方法相比也有更高的分类准确率。  相似文献   

17.
基于条件信息熵的自主式朴素贝叶斯分类算法   总被引:9,自引:0,他引:9  
朴素贝叶斯是一种简单而高效的分类算法,但其条件独立性和属性重要性相等的假设并不符合客观实际,这在某种程度上影响了它的分类性能。如何去除这种先验假设,根据数据本身的特点实现知识自主学习是机器学习中的一个难题。根据Rough Set的相关理论,提出了基于条件信息熵的自主式朴素贝叶斯分类方法,该方法结合了选择朴素贝叶斯和加权朴素贝叶斯的优点。通过在UCI数据集上的仿真实验,验证了该方法的有效性。  相似文献   

18.
加权稀疏表示分类(WSRC)在声频传感器网络下的车辆识别中取得了不错的效果。但是稀疏表示分类(SRC)中实际上起较大作用的是字典中所有类的协同表示,因此协同表示分类(CRC)被提出用来提升算法效率,CRC框架还改进了残差计算方式来提高识别精度。在WSRC中发现保局性对提升识别率起到很好的作用,因此在CRC中引入加权编码,提出了声频传感器网络下基于加权协同表示分类(WCRC)的车辆识别方法,取得了明显的速度(相比WSRC、SRC)以及不错的精度(对比WSRC、CRC、SRC)提升。同时针对欧氏距离对样本相似性判断的不足,将曼哈顿距离引入加权编码,进一步地提出了基于曼哈顿距离加权协同表示分类(Manhattan-WCRC)的车辆识别方法,取得了最高的识别率,而运算速度与WCRC接近。  相似文献   

19.
论文主要研究朴素贝叶斯算法在支气管炎诊断中的应用.首先,对支气管炎患者的问卷调查数据进行离散化处理,学习到支气管炎类型与病症症状的模型;然后基于此模型,利用朴素贝叶斯算法求出该模型的最大后验概率分布,从而确定患者所属的支气管炎类型.  相似文献   

20.
朴素贝叶斯分类器在地形评估中的应用方法   总被引:3,自引:0,他引:3  
针对目前流行的评估方法的缺点以及实际问题的具体情况,提出将朴素贝叶斯分类器应用在地形评估中。具体方法是从用专家函数评估的数据库中提取训练样本,通过基于分布熵最小原则进行特征约减,再基于最优性条件进行属性离散化,最后基于共轭分布进行参数学习得到一个的分类器。待分类样本可以直接由贝叶斯分类器得出分类结果,并且根据增量学习理论,将分类结果作为训练新的分类器的训练样本,可以进一步提高分类精度。试验表明该方法的应用减少了评估时间,并且分类精度也令人满意。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号