首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
潘伟  佘堃 《计算机应用》2017,37(3):796-800
针对多规则有序决策系统中的偏好决策问题,根据有序决策的偏好不一致特性,提出了一种基于偏好不一致熵的偏好决策方法。首先,定义了样本的偏好不一致熵(PIEO),用来度量特定样本相对于样本集的偏好不一致程度;然后,根据偏好决策中不同属性对决策的重要性不同的特点,提出了一种加权的样本偏好不一致熵,并结合属性偏好不一致熵在度量属性重要性方面的能力,给出了一种基于属性偏好不一致熵的权值的计算方法;最后,提出了一种基于样本偏好不一致熵的偏好决策算法。采用Pasture Production和Squalsh两个数据集进行仿真实验,基于全局偏好不一致熵分类后,各属性的偏好不一致熵普遍比基于向上和向下偏好不一致熵分类后的熵值小,而且更接近原始决策的偏好不一致熵,这说明基于全局偏好不一致熵的分类比其他两种情况的分类效果好。分类偏离度最小低至0.1282,这说明分类的结果比较接近原始决策。  相似文献   

2.
社会发展的同时带来大量数据的产生,不平衡成为众多数据集的显著特点,如何使不平衡数据集得到更好的分类效果成为了机器学习的研究热点。基于此,对目前存在的不平衡数据集分类方法进行综述研究,从不平衡数据采样方法、基于机器学习的改进算法以及组合方法三个层面对目前存在的方法进行全面的梳理与总结,对各方面方法所解决的问题、算法思想、应用场景以及各自的优缺点进行归纳和分析,同时对不平衡数据集分类方法存在的问题和未来研究方向提出一些总结和展望。  相似文献   

3.
针对深度学习单一模型不能有效处理不确定性预测结果的问题,文中从三支决策出发,将阴影集理论引入图像分类中,构建两阶段图像分类方法.首先,使用卷积神经网络分类样本,获得隶属度矩阵.然后,使用基于阴影集的样本划分算法处理隶属度矩阵,获得分类结果中存在不确定性的部分,即不确定域,进行延迟决策.最后,使用特征融合技术,将SVM作为分类器进行二次分类,降低分类结果的不确定性,提高分类准确率.在CIFAR-10、Caltech 101数据集上的实验验证文中方法的有效性.  相似文献   

4.
基于聚类融合的不平衡数据分类方法   总被引:2,自引:0,他引:2  
不平衡数据分类问题目前已成为数据挖掘和机器学习的研究热点.文中提出一类基于聚类融合的不平衡数据分类方法,旨在解决传统分类方法对少数类的识别率较低的问题.该方法通过引入"聚类一致性系数"找出处于少数类边界区域和处于多数类中心区域的样本,并分别使用改进的SMOTE过抽样方法和改进的随机欠抽样方法对训练集的少数类和多数类进行不同的处理,以改善不同类数据的平衡度,为分类算法提供更好的训练平台.通过实验对比8种方法在一些公共数据集上的分类性能,结果表明该方法对少数类和多数类均具有较高的识别率.  相似文献   

5.
直接将传统的分类方法应用于不平衡数据集时,往往导致少数类的分类精度低下。提出一种基于K-S统计的不平衡数据分类方法,以有效提高少数类的识别率。利用K-S统计评估分类与特征之间的关系,去除冗余特征,并且构建K-S决策树获得数据分片,调整数据的不平衡度;最后对分片数据双向抽样调整,进行分类学习。该方法使用的K-S统计假设条件极易满足,其效率高且适用性强。通过KDD99入侵检测数据的分析对比表明,对于不平衡的数据集,该方法对多数类及少数类都具有较高的分类精度。  相似文献   

6.
为了解决文本情感分析的代价不平衡及静态决策中分类代价偏高的问题,文中考虑动态决策过程中产生的误分类代价和学习代价,构建基于序贯三支决策的代价敏感文本情感分析方法.首先,为了构建多粒度动态决策环境,提出针对文本数据的粒化模型.然后,引入序贯三支决策模型,构建动态文本分析框架.最后,利用真实文本评论数据集验证文中方法的有效性.实验表明文中方法在提高分类质量的同时,明显降低整体的决策代价.  相似文献   

7.
多个对象同时讨论时,对文本的情感分析结果与针对特定对象的情感倾向可能不一致,对象级情感分类任务需在文本整体语义的场景下,重点关注与给定对象相关的内容.文中提出融合词性和注意力的卷积神经网络对象级情感分类方法.引入词性信息,通过长短时记忆神经网络建模输入序列,构建对象注意力,将注意力融入到卷积神经网络结构中分析关于给定对象的情感倾向.词性信息有助于捕获与对象具有修饰关系的内容和弱化内容或距离相近但无搭配关系的句子成分的影响.结合长短时记忆神经网络和卷积神经网络结构建模文本,更有利于同时建模文本整体语义与对象相关语义.在SemEval2014数据集上的实验表明,文中方法取得优于基于长短时记忆神经网络的注意力机制方法的分类效果.  相似文献   

8.
如何在海量不确定数据集中提高频繁模式挖掘性能是目前研究的热点.传统算法大多是以期望、概率或者权重等单一指标为数据项集支持度,在大数据背景下,同时考虑概率和权重支持度的算法难以兼顾其执行效率.为此,本文提出一种基于Spark的不确定数据集频繁模式挖掘算法(UWEFP),首先,为了同时兼顾数据项的概率和权重,计算一项集的最大概率权重值并进行剪枝;然后,为了减少对数据集的多次扫描,结合Spark框架的优点,设计了一种具有FP-tree特征的新颖的UWEFP-tree结构进行模式树的构建及挖掘;最后在Spark环境下,以UCI数据集进行实验验证.实验结果表明本文的方法在保证挖掘结果的同时,提高了效率.  相似文献   

9.
王林  郭娜娜 《计算机应用》2017,37(4):1032-1037
针对传统分类技术对不均衡电信客户数据集中流失客户识别能力不足的问题,提出一种基于差异度的改进型不均衡数据分类(IDBC)算法。该算法在基于差异度分类(DBC)算法的基础上改进了原型选择策略。在原型选择阶段,利用改进型的样本子集优化方法从整体数据集中选择最具参考价值的原型集,从而避免了随机选择所带来的不确定性;在分类阶段,分别利用训练集和原型集、测试集和原型集样本之间的差异性构建相应的特征空间,进而采用传统的分类预测算法对映射到相应特征空间内的差异度数据集进行学习。最后选用了UCI数据库中的电信客户数据集和另外6个普通的不均衡数据集对该算法进行验证,相对于传统基于特征的不均衡数据分类算法,DBC算法对稀有类的识别率平均提高了8.3%,IDBC算法对稀有类的识别率平均提高了11.3%。实验结果表明,所提IDBC算法不受类别分布的影响,而且对不均衡数据集中稀有类的识别能力优于已有的先进分类技术。  相似文献   

10.
在机器学习和数据挖掘实际应用中,针对分类训练集的选取,通常要求训练集中每一类所包含的数据在数量上要尽可能的"均衡".本文以非均衡训练集与分类学习效率关系研究为依据,给出了"均匀度"和"内聚度"两种类型的训练集非均衡程度因素的概念;"均匀度"是用来描述训练集类之间(between-class)的非均衡程度,其含义是指训练集不同类之间数据数量的非均衡程度;"内聚度"是用来描述训练集类内部(within-class)的非均衡程度,指训练集中不同类在空间分布上的线性相关程度,通过训练集数据之间的相关程度,构建出训练集的网络结构,运用一种能体现训练集内聚性的网络拓扑结构的指标-网络社区结构作为度量,提出了基于网络社区模块结构的非均衡训练集度量方法,并指出了高均匀度和高内聚度是选取"优良"分类训练集的关键因素.通过对UCI标准训练集的实验,结果验证本方法作为选取训练集标准的有效性.  相似文献   

11.
通过研究决策表和决策规则的不确定性,分析了由不分明关系划分的粒度引起的规则不确定性的两个方面,即不一致性和随机性,建立基于信息熵和粗糙集表示的不确定性信息度量的方法.利用该方法计算决策表局部最小确定性,并以此为阈值来控制规则集生成的数量,避免不必要的冗余规则的生成.同时结合Skowron的缺省规则获取算法,实现了没有领域先验知识条件下的不确定知识的自适应学习过程.试验结果表明.阈值的选取是合理的,在保持较高的决策正确率的同时,有效地控制了规则集的生成.  相似文献   

12.
增量式属性约简是一种针对动态数据集的新型属性约简方法。然而目前的增量式属性约简很少有对不完备混合型的信息系统进行研究。针对这类问题提出一种属性增加时的增量式属性约简算法。在不完备混合型信息系统下引入邻域容差关系。基于邻域容差关系的粒化单调性,提出信息系统属性增加时邻域容差条件熵的增量式更新方法,并提出了不完备混合型信息系统下的邻域容差条件熵增量式属性约简算法。实验分析表明了该算法的有效性。  相似文献   

13.
汪琼枝  郑文曦  王道然 《计算机科学》2016,43(Z6):81-82, 102
属性约简是Rough集理论的重要研究内容,基于信息熵的属性约简是一种有效的属性约简方法。在实际应用中,获取的信息系统通常是不完备的。针对这种问题,在容差关系下对个体进行分类时,基于属性子集redu与CAttr(属性全集)-redu之间的内在联系,定义了一种新的知识熵,提出了一种新的应用近似模糊熵的不完备信息系统属性约简算法(newS算法),其时间复杂度是O(|C|2∑mi=1(kpi)2)。最后,在ROSE和UCI data中的6个数据集上进行了实验仿真,结果表明newS算法是可行的,并且在同等约简效果下与其他算法相比具有更高的属性约简效率。  相似文献   

14.
针对概率犹豫模糊环境下属性权重完全未知的多属性决策问题,提出基于符号距离和交叉熵的多属性决策方法.首先,定义用于测量决策者犹豫程度的3种概率犹豫模糊元的犹豫度:数值犹豫度,信息不完全度和总犹豫度,基于3种犹豫度提出概率犹豫模糊符号距离;然后,为了避免人为添加元素,定义调和概率犹豫模糊元,并结合信息不完全度提出概率犹豫模糊元的交叉熵;最后,根据概率犹豫模糊元的符号距离和交叉熵构建多属性决策模型,并通过算例验证了该模型的有效性和合理性.  相似文献   

15.
为解决不完备信息的偏好决策问题,多种优势关系及其相应的粗糙集模型被提出并证实其实用性. 然而在实际情况中,只要存在缺失值那么无论使用何种方法对比出来的优势关系都存在一定的不确定性. 基于此,本文分析了影响灰度大小的因素,定义了优势关系中灰度和差异系数的概念并给出了计算方法,建立了两对象间进行对比的灰度度量. 提出了基于灰度的优势关系及其粗糙集近似模型. 与广义扩展优势关系和扩展优势关系相比,基于灰度优势关系的粗糙集模型近似分类精度和质量均有提高. 最后通过实例证明了灰度优势关系及其粗糙近似模型的实用性.  相似文献   

16.
针对电力系统,设备(资产)运维管理系统(PMS)与调度管理系统(OMS)之间的设备缺陷互联需要PMS运维人员进行主观判断及手动选择操作,导致人员工作量大幅增加且数据交互的不合理程度和不完备程度也逐渐增大,本文提出了基于标签技术和熵权法的缺陷推荐方法.该方法首先以基于正向最大匹配算法、编辑距离和规则库的标签技术对缺陷数据进行标签化标识,然后采用熵权法对其标签进行评价,进而实现向调控员进行智能化推荐缺陷的目的.实验结果表明,通过该缺陷推荐方法的实施,显著减少了运维人员的缺陷选择工作量,并提升了缺陷信息推荐的准确性.  相似文献   

17.
在多个ES协作系统中不一致性问题的处理   总被引:1,自引:0,他引:1  
在由多个领域相关的ES组成的协作系统中,通常把能独立求解同一个领域难题A的所有ES组成一个协作组。有时组中诸ES对A都给出了相同的断言,但是它们却给出了不同的断言信度值。本文为处理这种不一致性问题,改进了文[1]中的向最高信度值看齐策略和相邻影响策略,提出了向最高权威看齐策略和相互影响策略,并给出了基于模糊 熵、范数和均差值的协作组统一信度值最大偏差的三种计算方法。这些计算方法都是以组中诸信度值不一致性程度的度量为基础的。  相似文献   

18.
Rough set theory is a useful mathematic tool for dealing with vague and uncertain information. Shannon's entropy and its variants have been applied to measure uncertainty in rough set theory from the viewpoint of information theory. However, few studies have been carried out on information-theoretical measure of attribute importance in incomplete decision system (IDS) considering the relation between decision attribute and condition attributes. In this paper, we introduce the concept of conditional entropy together with entropy and joint entropy in IDSs. By using the new conditional entropy, we propose a measure for attribute importance. Based on the measure, a heuristic attribute reduction algorithm is presented. Some test experiments on real-lift data-sets show the effectiveness of the algorithm. The attribute importance measure and the attribute reduction algorithm can be used in data mining or machine learning for handling incomplete data.  相似文献   

19.
针对不完备信息系统中各种自反二元关系形成了对系统的覆盖而非划分的情况,提出利用对象的邻域来定义粗糙熵和粒度度量以衡量系统的不确定性,证明了以上不确定性度量同完备信息系统的不确定性度量是一致的.同时在覆盖可约简的情况下,定义了覆盖约简对系统的粗糙熵和粒度度量,研究结果表明在系统分类最细或最粗时,覆盖约简的不确定性和知识的不确定性是等价的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号