共查询到20条相似文献,搜索用时 187 毫秒
1.
在大数据库中确定关键条件属性集,是使用基于粗集理论的集合论生成分类规则算法的重要步骤。该文在简述分类规则形成算法的基础上,对确定关键条件属性集的模糊聚类算法进行了详细的讨论,并给出该方法应用的一个实例。 相似文献
2.
在经典形式背景中,利用对象和属性间的二元关系定义一对粗糙模糊上、下近似算子,讨论算子的基本性质,指出算子与已有粗糙近似算子的关系.利用定义的粗糙模糊上、下近似算子,得到两类决策规则,即确定性决策规则和可能性决策规则.针对两类决策规则,提出下近似约简和上近似约简的概念,关于上近似约简,得到可约属性和属性协调集的判别条件,给出属性约简方法,并举例说明方法的可行性. 相似文献
3.
4.
5.
分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法.它基于样本属性值分割点对实例样本进行分类,把分割点对实例样本的分类能力作为分割点选择的依据,将所有相容样本划分为分类属性值相同的子集作为停机条件,实现连续属性样本分类规则挖掘的完全自动化.它考虑到数据挖掘的目标和要求,充分利用属性与类间的依赖性、属性间的互补性,达到样本分割点数少、分类规则简单和属性约减的目的.最后通过实例进行了验证,并与C4.5算法进行了比较. 相似文献
6.
为了进一步提高数据表示和数据挖掘的效率,对两类特殊概念即对象概念和属性概念进行了研究。分析了对象概念和属性概念与不可约元的关系,提出了对象概念和属性概念的识别算法;提出了以属性概念为递归终止条件的计算内涵缩减递归算法;研究了属性排序以及属性序列在规则提取中的应用。 相似文献
7.
张淮中 《计算机工程与应用》2003,39(13):125-126
探讨了决策规则的数据约简问题,对条件属性与决策属性在决策表中的概率关联给出了有关结论,推导出基于先验概率的决策规则冗余条件,从而获得基于先验概率的数据约简方法,并用应用实例进行了验证。 相似文献
8.
9.
10.
关联规则在肿瘤诊断中的应用 总被引:6,自引:0,他引:6
挖掘肿瘤诊断数据库中的关联规则,能为肿瘤诊断提供有用的信息。肿瘤诊断数据库中的属性常为数量型属性,因此如何将数量型属性离散化是挖掘关联规则的难点。竞争聚集算法综合了分层聚类与划分聚类的优点,它能够有效地体现数据的实际分布情况并得到优化的聚类个数,因此能将数量型属性离散化成若干个优化的区间。 相似文献
11.
12.
一种基于知识粒度的启发式属性约简算法 总被引:1,自引:0,他引:1
属性约简是粗糙集理论进行知识获取的核心问题之一。根据属性相似度与知识粒度的一致性,通过条件属性与决策属性以及条件属性之间的相似度度量,提出了一种基于知识粒度的启发式属性约简算法。根据条件属性与决策属性的相似度对条件属性进行降序排列,根据条件属性之间的相似度度量选择重要的属性,从而得到约简集合。理论分析与实验结果表明,该算法具有较高的运行效率和较好的约简效果。 相似文献
13.
智能决策中的模糊近似 总被引:1,自引:1,他引:1
信息表通过目标集合来描述,目标通过条件属性和决策属性进行描述,在对这样的信息表分析处理过程中,粗糙集理论是一个非常有用的工具,粗糙集合理论的主要观点就是知识的上下近似,在实际中,条件属性和决策属性的概念通常是模糊的,而且可以利用模糊集合来说明,提出了基于模糊集合和粗糙集结合的一种新方法,对包含度进行了定义,给出了截近似和综合函数的概念,应用这些概念并结合具体例子讨论了条件属性和决策属性之间的关系,为决策过程中对条件属性权值的指定提供了理论基础。 相似文献
14.
针对空缺数据项较多的不完整决策表,通过计算条件模式对决策类的隶属度、条件模式的相容类包含于决策类的程度来研究条件模式与决策类的从属关系。对这两种方法进行了分析和对比实验,表明了二者的一致性。将新元素的条件属性模式与已有条件模式进行匹配,可以得出新元素应属于的分类。 相似文献
15.
决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性离散化算法。首先使用决策强度来度量条件属性的重要性,并据此对条件属性按照属性重要性从小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法易于理解,计算简单,算法的时间复杂性为O(3kn2)。 相似文献
16.
当信息系统的对象和决策属性不变而不断增加条件属性时,为了获得该系统的最小约简属性,一般方法是对决策表的所有数据进行重新计算,很显然这种方法不可取。在粗糙集理论的基础上,给出了过渡相对差异比较表的定义,提出一种新的增加条件属性的最小约简算法。实例说明:该算法节省了大量的时间和空间的资源,并且结论与传统的算法得到的属性最小约简的结论是一致的,所以该算法具有一定的适用价值。 相似文献
17.
基于粗集和熵的多变量决策树的构造算法 总被引:1,自引:0,他引:1
多变量决策树是一种有效用于分类的数据挖掘方法,构造的关键是根据属性之间的相关性选择合适的属性组合作为节点。针对传统方法中用相对核进行多变量检验中属性选择存在的不足,首先对每个节点包含的属性个数加以限制,然后由重新定义的属性依赖度和基于条件熵的距离函数选择相关的属性组合作为节点,从而提出一种新的构造算法。实例说明,该算法不仅有效降低了树的高度,而且还兼顾了分类的可读性。 相似文献
18.
基于总线桥协议的异构机群并行虚拟机的构造 总被引:2,自引:0,他引:2
BBP_PVM是为北京航空航天大学计算机系基于总线桥协议的异构可扩展并行计算机群系统BBP_SPC(busbridgeprotocol-scalableparalelcomputer)研制的PVM版本.BBP_PVM以总线桥多机互联协议的消息传递层子协议(BBP_MPL)为虚拟机内各处理机间的通讯协议.BBP_MPL是在BBP可靠链路的基础上实现的精简和可靠的机间通讯协议,BBP_MPL的采用有效地降低了通讯过程中报文应答、重发和动态缓冲区管理的开销.BBP_PVM与PVM3.3.4及其以上版本兼容. 相似文献
19.
现实世界中的有序性问题,反映在决策表上相当于在表的属性域上加上优先关系(preferential ordering)或者说是序关系的语义,这种决策表称为有序决策表,有序决策表中的条件属性又称为指标(criterion),有序决策表中的对象在各个指标上有排序,在决策属性上又有一个总的排序。文献[1,2]指出对于有序决策表中存在一种普通的粗糙集模型不能识别的不一致,并以基于支配关系(dominance relation)的粗糙集模型(dominance-based rough set approach or DRSA)代替基于等价关系的经典粗糙集模型(classic rough set approach or CRSA),DRSA可以处理这种不一致,文中则进一步指出有序决策表中还存在另一种不一致,不仅在应用上进一步完善了对有序表的处理,而且在理论上丰富了粗糙集中不一致的内涵。 相似文献