首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 194 毫秒
1.
一种具有区间数信息的多属性大群体决策方法   总被引:2,自引:0,他引:2  
针对属性值为区间数的多属性多方案大群体决策问题,提出一种区间数聚类算法.通过该聚类算法将方案的属性值聚类,得到方案的群体偏好矩阵,再利用诱导有序加权平均算子集结确定属性的权重,根据方案的综合评价值给出方案排序,进而提出大群体决策方法.该方法较好地避免聚类阈值选取的经验性,提高决策结果的可信度.实例分析验证了方法的有效性和实用性.  相似文献   

2.
为解决经典粗糙集理论在处理连续、离散混合属性决策表离散化时规则数多、准确率低的问题,采用基于贪心算法和属性值区间概率相结合的离散化方法,该方法针对传统的对混合决策表仅考虑连续属性离散化的问题。首先运用改进的贪心算法对混合决策表中的连续属性进行初步离散化,然后计算连续属性各属性值区间概率,并对取值概率大的区间细化,最后再考虑对原来的离散属性进一步离散化,从而增强系统分辨能力;且离散化后的决策表总是相容的,与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息。通过仿真分析验证了该方法的有效性。  相似文献   

3.
连续属性离散化在数据分析的数据预处理中非常重要。本文提出一种基于类信息熵的有监督连续属性离散化方法。该方法运用了粗集理论中决策表的一致性水平的概念。算法分成两部分:首先根据决策表的一致性水平动态调整聚类类别数目,运用分级聚类形成初始聚类。然后,基于类信息熵合并相邻区域,减少区间数目。实践证明该方法是可行的。  相似文献   

4.
针对Naive Scaler的改进   总被引:1,自引:0,他引:1  
决策表离散化要求决策表中原有的分类结果不变,而NaiveScaler算法在离散化时,有些根据不可分辨关系应该得到的断点很可能被丢掉,造成决策表信息的丢失.针对这一问题,对其进行了研究并改进.原算法在扫描相同条件属性值而决策值不同的对象时,由于这些对象的排序不同可能造成离散的结果不同.主要是在这里某些断点可能被遗漏,并引进新的冲突.为此,当条件属性值变化时查看其决策属性值,若有不同决策属性值则追加断点以消除断点被丢掉的可能.进而使得到的初始断点集更可靠.最后给出实例表明该算法有效.  相似文献   

5.
提出一种数据约简算法.该算法从决策表中条件属性的等价类族考虑,分析决策值的等价类族,在约简过程中,可同时进行属性约简与属性值约简.与基于分析法或区分矩阵的传统约简等算法相比,本文算法可省略属性值约简中繁琐的比较过程,减少比较次数,提高约简效率.  相似文献   

6.
一种改进的快速数据离散化算法   总被引:1,自引:0,他引:1  
提出一种新的基于粗糙集理论的快速数据离散化算法FRSBD(Fast Rough Set based Discretization Algorithm),文章定义了属性决策关系矩阵等概念.证明了一组基于属性决策关系矩阵的断点判定规则的有效性,并基于该新的断点判定规则,实现了决策表中连续属性值的快速离散化.理论分析说明了FRSBD的正确性和有效性,仿真结果表明该算法优于文献报道的同类算法.  相似文献   

7.
傅德月 《计算机应用》2010,30(6):1536-1538
针对粗糙集对于连续域属性决策表的处理能力差以及不容易获得模糊集之间关系等问题,提出一种基于连续型属性的硬C均值(HCM)聚类约简算法。该算法首先引入三角隶属度函数将连续属性值转化为模糊值,并使用HCM聚类方法获得数据集之间关系。实例验证表明:采用该算法,用户可以根据实际决策需要和领域知识更改阈值,从而获得满意的属性结果。  相似文献   

8.
印勇  孙如英 《计算机工程》2008,34(10):86-88
引入模糊C均值聚类算法进行连续属性模糊化,通过聚类有效性分析来确定最佳分类数目,克服了属性模糊化方法需要人为确定划分类数的缺点。用属性模糊化得到的属性隶属度矩阵约简模糊粗糙属性,由此提出一种基于模糊粗糙集的属性约简算法。实例验证了该方法的可行性和有效性。  相似文献   

9.
决策系统中连续属性的离散化,即实型属性空问向整型属性空间的映射,它是对决策表中属性约简的第一步.针对多值决策属性的决策信息系统,提出一种新的属性离散化算法.首先根据决策属性的不同,将条件属性集划分为不同的序列,对每两个序列求取候选断点,最后,综合所有的候选断点即为所求的候选断点集合;然后在基于条件属性重要度和贪心算法的基础上提出一种确定结果断点子集的新启发式算法.实例验证了本文所提出的算法能够取得较理想的连续属性离散化结果.  相似文献   

10.
和导航中应用广泛。文本聚类作为一种无监督学习算法,其依据是聚类假设:同类的文档相似程度大,不同类的文档相似程度小。文中主要研究汉语文本聚类算法在新闻标题类文本中的应用。首先对采集到的若干条新闻标题进行分词和特征提取,将分词后的文本转化为词条矩阵;然后使用TF-IDF技术处理词条矩阵,得到基于分词权重的新的词条矩阵,对新的词条矩阵进行奇异值分解,得到主成分得分矩阵,提取主成分分析文本特征并根据主成分得分矩阵进行K-均值和分层聚类分析;最后将聚类结果用词云图的形式展示出来并评价聚类效果的好坏。实证显示,对词条矩阵的奇异值分解能降低向量空间的维数,提高聚类的精度和运算速度。  相似文献   

11.
卢星凝  张莉 《计算机应用》2015,35(10):2793-2797
针对遗传算法(GA)与支持向量机(SVM)集成相结合的疾病诊断方法存在属性冗余的问题,提出了一种改进的约简和诊断乳腺癌决策方法。该方法将最小化约简属性个数、最大化区分矩阵可区别属性的个数以及最大化约简属性对决策属性的依赖度这三种目标函数相结合作为GA的适应度函数。在约简属性后取多个子集,以便利用SVM集成学习。在UCI数据库中乳腺癌数据集的实验表明,与原始的SVM算法相比,该方法在分类诊断的准确度以及敏感性方面有一定的提高,其中分类准确度至少提高了2%。  相似文献   

12.
一种基于粗集理论的增量式属性约简算法   总被引:3,自引:1,他引:2  
增量式学习中,当信息系统的对象和决策属性不变而不断增加条件属性时,为了获得该系统的约简属性,一般方法是对决策表中的所有数据重新计算,但这种方法显然效率很低且不必要.在粗集理论的基础上,给出相对区分矩阵和绝对区分矩阵的定义,提出一种新的增量式属性约简算法.通过实例得知:由该算法得到的属性约简与传统算法得到的属性约简结果相同,但该算法不仅降低了时间复杂度而且其分类质量一般要优于原来的分类质量,所以该属性约简具有一定的实用价值.  相似文献   

13.
洪菁  陈强  刘惠彬 《微机发展》2006,16(10):32-34
对传统的粗糙集理论进行了扩展,提出了一种改进的粗糙集归纳学习方法。一方面,针对连续属性离散化,利用模糊集理论对连续属性进行模糊化,再根据模糊贴近度构造模糊相似矩阵,并用k-w方法粗略评估各连续属性的重要度,建立基于模糊相似关系的划分,最终生成相容的决策表。另一方面,针对解决最优属性的选择问题,提出一种加权求和的属性重要度定义。基于以上模型开发了一个原型系统,并以一个工程实例验证了此方法的有效性。  相似文献   

14.
15.

信息观下研究邻域决策系统的属性约简是一种新颖的思路. 通过分析论域下某样本邻域中其他样本与该样本决策属性值的异同, 定义不一致邻域矩阵. 在计算属性重要度时, 利用不一致邻域减少在原条件属性基础上增加一个属性后条件熵的计算时间. 分析得到邻域系统下条件熵与正域的关系, 提出一种信息观下基于不一致邻域矩阵的属性约简算法, 并分析该算法与其他算法的内在联系. 实验结果验证了所提出算法的有效性.

  相似文献   

16.
针对新能源智能车监控数据中包含过多的连续属性,提出了一种基于分辨矩阵和信息增益率的有监督离散化算法,从而降低连续属性的取值精度,使得新能源智能车后续的分类模型建立更具泛化能力.该算法在保证分类效果的前提下,获得尽可能少的结果断点,主要从3个方面对传统的离散化算法进行优化,一是根据决策表的条件属性与决策属性构建候选断点分辨矩阵,通过分辨矩阵判断相邻属性取值之间是否有可能的断点;二是用信息增益率来优化结果断点的选取;三是通过设定停止阈值解决了传统算法因停止条件过于严格导致算法选取过多的结果断点、离散化效果一般的问题.实验结果表明,改进的算法能够有效减少断点数量,大幅提高计算效率,并获得与经典算法相近的离散结果.  相似文献   

17.
分析多属性决策方法中决策矩阵规范化和属性权重计算等步骤可能对决策方法合理性造成的不良影响,为克服这些不良影响,提出一种新的多属性决策方法.该方法采用群决策模式进行赋权,在对专家意见进行一致性分析的基础上,集结各位专家给出的属性权重,通过定义备选方案在属性值为实数、区间数和语言值等不同类型属性上的相对优势关系构造判断矩阵,并以此建立方案效用值计算的线性目标规划模型,从而实现备选方案的评价和排序.实例研究表明了所提出方法的可行性和有效性.  相似文献   

18.
黄兵  李华雄 《计算机科学》2011,38(10):223-227
针对我国政府审计机关对政府投资的I`I}项目进行绩效审计评价规则知识获取的困难,考虑了条件属性取值 为优势精确值、分类结果为直觉模糊值的决策系统规则获取问题。首先比较条件属性值的大小,构建对象的优势部 域,再由对象邻域的直觉模糊值确定对象的上下近似;根据对象的上下近似和不同对象的直觉模糊值确定对象间的区 分关系,利用分辫矩阵给出知识约简和规则提取算法;最后将直觉模糊粗糙模型应用于政府I"I'项目绩效审计评价规 则的获取,得到了较为合理的IT项目绩效评价规则。  相似文献   

19.
White  Allan P.  Liu  Wei Zhong 《Machine Learning》1994,15(3):321-329
A fresh look is taken at the problem of bias in information-based attribute selection measures, used in the induction of decision trees. The approach uses statistical simulation techniques to demonstrate that the usual measures such as information gain, gain ratio, and a new measure recently proposed by Lopez de Mantaras (1991) are all biased in favour of attributes with large numbers of values. It is concluded that approaches which utilise the chi-square distribution are preferable because they compensate automatically for differences between attributes in the number of levels they take.  相似文献   

20.
Inductive learning systems can be effectively used to acquire classification knowledge from examples. Many existing symbolic learning algorithms can be applied in domains with continuous attributes when integrated with a discretization algorithm to transform the continuous attributes into ordered discrete ones. In this paper, a new information theoretic discretization method optimized for supervised learning is proposed and described. This approach seeks to maximize the mutual dependence as measured by the interdependence redundancy between the discrete intervals and the class labels, and can automatically determine the most preferred number of intervals for an inductive learning application. The method has been tested in a number of inductive learning examples to show that the class-dependent discretizer can significantly improve the classification performance of many existing learning algorithms in domains containing numeric attributes  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号