共查询到20条相似文献,搜索用时 59 毫秒
1.
知识获取是构造专家系统的“瓶颈”,提供准确的推理知识是进行决策规划的关键。文中运用粗糙集理论,通过粗糙集的约简消除冗余的条件属性,实现对知识库的精简。首先研究知识获取,在阐明知识的层次结构基础上,给出了概念化、形式化、知识库求精三个知识获取过程;然后研究属性约简算法,在研究集合差异度和属性的重要性、约简算法推导过程的基础上,给出了属性约简算法的六个步骤。最后根据属性约简算法及其步骤,对功能点分析法构建软件成本估算专家系统时,组成技术复杂因子的14个因素进行了约简。 相似文献
2.
粗糙集理论是一种有效的处理不一致、不精确和不完备等各种信息的数学分析工具。属性约简算法是粗糙集理论的关键技术之一,是数据挖掘研究的一个重要课题,也是知识获取中研究的关键问题之一。高效的属性约简算法使属性约简的求解被证实是一个NP-Hard问题,它通常是一个预处理阶段,使适应决策表上的分类分析。本文提出一种有效的方法——SEGMENT-SIG,可以得到最小约简子集,保持决策表的分类一致性。本文对算法最坏的时间计算复杂度进行了分析,该算法的输出是两种不同的分类器,一个是IF-THEN规则体系,另一个是决策树。 相似文献
3.
基于属性重要性的逐步约简算法 总被引:16,自引:3,他引:16
粗糙集理论研究的重要内容之一是知识约简的有效性计算问题,目前求解知识约简的算法主要有两种:一种是利用辨识矩阵构造区分函数,另外一种是基于属性重要性的启发式算法.这两种算法均能求得决策系统的最小或次小约简,但由于计算的复杂度高,所以当数据量增大时这些算法的计算性能是不能令人满意的.本文在对后一种算法充分研究的基础上设计了基于属性重要性的逐步约简算法,利用在决策系统中己获得的正区域逐步缩小数据处理范围,减少求解时间.本文将该算法与基于属性重要性的算法进行了实验比较并对结果进行了分析. 相似文献
4.
5.
一种基于粗糙集的决策系统属性约简算法 总被引:28,自引:1,他引:28
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。 相似文献
6.
一种基于差别矩阵属性约简的完备算法 总被引:1,自引:0,他引:1
为获取一个较优的属性约简集,在对粗糙集中基于差别矩阵的属性约简算法研究的基础上,文中提出了一种新的属性约简算法.该算法对由差别矩阵得到的属性差别集进行运算,得到一种集合内元素之间没有包含关系的新集合,在分析该集合性质的基础上,给出针对该集合的一个较优属性约简集.最后对时间复杂度进行了分析,并给出了完备性证明. 相似文献
7.
8.
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法.该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简. 相似文献
9.
基于属性重要性的属性约简算法 总被引:2,自引:0,他引:2
粗糙集理论是一个新的处理不确定性问题的数学工具,属性约简是粗糙集理论的核心问题之一。为了获得决策系统中更好的相对属性约简,提出一种基于属性重要性的属性约简算法。将可辨识矩阵中出现次数多少作为属性重要性的判断依据。算法还考虑了当出现次数相同的情况下属性选择问题,由此定义新的属性重要性,以新的属性重要性为启发信息,分析表明,提出的算法是有效可行的。 相似文献
10.
属性约简自寻优算法 总被引:24,自引:1,他引:24
属性约简是知识获取中的关键问题之一。为了能够较为有效地获得较优的属性约简,首先在粗糙集理论的基础上构造出了相对差异比较表,然后把它与启发性知识相结合分别设计出了3个算法:属性约简的改进算法(AR1),属性约简判定的完备算法(RJ)和属性约简的改进增强算法(AR2);接着,将这些算法作为子算法并吸收了基因算法的基本思想和模拟退火算法的具体操作,设计出了属性约简自寻优算法(ADSOA);最后,将该算法应用于中医类风湿关节炎诊断决策表的约简。实验结果表明,属性约简自寻优算法能够以较大的概率和较高的效率获得较优的属性约简,对于某些具体问题来说甚至能够获得最佳的属性约简;这也同时表明相对差异比较表的提出对于进一步构造效率更高的属性约简算法具有较大的实际意义。 相似文献
11.
粗糙集的划分贴近度及基于划分贴近度的属性约简算法 总被引:1,自引:0,他引:1
Rough集理论是近年来发展起来的一种处理不确定、不精确、不完整数据的数学工具.属性约简是粗糙集的核心内容之一.本文提出了一个新的不确定性度量一划分贴近度,并基于划分贴近度分别提出了对一般信息系统和决策信息系统进行属性约简的算法,对决策信息系统进行约简的算法不仅可以对一致决策表进行约简,还可以对不一致决策表进行有效的约简. 相似文献
12.
13.
由于不完备信息系统不能完全适用于粗糙集等价类模型,其合理的属性约简方法的研究在当前是一个备受关注的研究热点。文章给出不完备信息系统等价关系的矩阵表示,同时给出了关于等价类矩阵以及核属性的相关定理,给出了应用等价类矩阵进行属性约简的方法和应用举例,为不完备信息系统的属性约简提供了一种新的方法。 相似文献
14.
15.
属性约简是粗糙集理论研究的核心内容之一,足知识获取的关键步骤.针对大规模数据集,基于决策表差别矩阵属性约简不具备可操作性缺点;以及基于差别矩阵属性频度的约简算法没有考虑到差别矩阵元素中属性个数多少的缺陷.基于差别矩阵元素的基数越小,其属性越重要的思想,按照基数由小到大的顺序,利用矩阵中具有相同基数的矩阵元素的簇集中属性出现的频度,确定属性的重要度,提出一种快速搜索属性约简算法,能快速搜索到属性的最优或次优约简.实验结果表明算法是可行、有效的. 相似文献
16.
属性约简的依赖度算法研究 总被引:6,自引:3,他引:6
属性约简是粗糙集理论中的一个重要内容,其核心任务是得到属性集的核。本着决策属性对条件属性的依赖程度,文章给出了属性约简的依赖度算法,并且给出了证明和实例。 相似文献
17.
概率差别矩阵与不完备信息系统属性约简 总被引:1,自引:0,他引:1
差别矩阵的概念是基于粗糙集理论对信息系统进行属性约简的一个重要内容。针对不完备信息系统的属性约简本文提出了一种概率差别矩阵的概念与构造方法,给出了相关的定理。在此基础上提出了一种利用概率差别矩阵对不完备信息系统属性约简的方法,并给出了应用举例。 相似文献
18.
基于正区域的属性约简是目前最常用的一类约简算法。现实中的决策表有可能存在不一致的对象。另外,在约简过程中随着属性个数的减少,也有可能产生新的不一致对象。对于基于正区域的约简算法来说,不一致的对象并没有提供任何有用的信息,删除不一致的对象不会改变正区域的计算结果以及最终的约简结果,而且可以显著提高算法的效率。然而现有的基于正区域的约简算法并没有考虑到这个问题,它们采用论域中的所有对象来计算正区域并得出约简结果。针对这一问题,定义了重构相容决策表和重构相容决策子表的概念。引入这两个概念的目的是在约简过程中删除初始决策表中的不一致对象,从而获得一个相容决策表。借助于这两个概念,提出了一种新的基于正区域的属性约简算法。在真实数据集上的实验表明,与传统的算法相比,该算法能够获得较小的约简结果和较高的分类精度,并且具有相对较低的时间复杂度。 相似文献
19.
粗糙集理论是一个新的处理不确定性问题的数学工具,属性约简是粗糙集理论的核心问题之一。但求解最优约简已被证明是一个NP—hard问题。基于属性重要度的启发式算法在属性约简中应用的较多.文中分别介绍了基于区分矩阵、基于相关矩阵和基于信息量的属性约简算法。对其思想进行了剖析和总结。 相似文献
20.
运用可辨识矩阵表示信息系统中所有对象的区分信息,为研究属性约简提供了新方向。然而,传统的可辨识矩阵在构造结束后才利用核属性消除冗余元素项,忽略了核属性在矩阵构建过程中的作用。针对这一问题,文中做了以下研究:1)优化可辨识矩阵的构造方式,在计算任意两个对象的区分信息之前,先判断核属性上的取值是否相等,如果不相等,则直接将对应元素项记为Φ,忽略对其他条件属性的判断;2)提出属性加权重要度的概念,综合考虑每个条件属性占可辨识矩阵中非空元素项的比率(称为宏观重要度)与每个属性对区分对象的贡献程度(称为微观重要度),并通过例子说明了该度量方法的合理性;3)针对优化后的矩阵仍然存在大量冗余元素和空集这一缺陷,结合差别信息树的概念提出基于优化可辨识矩阵和属性加权重要度的差别信息树。按照属性加权重要度对优化可辨识矩阵中所有非空元素项进行排序,使得重要度高的属性被更多的节点共享;且在构建过程中将不包含核属性的元素项映射到树中的一条路径上,而包含核属性的元素项则被直接忽略。最后,提出基于优化可辨识矩阵和改进差别信息树的约简算法HSDI-tree。在UCI的5个数据集上分别比较了HSDI-tree算法与CDI-tree,DI-tree和IDI-tree算法的约简结果和节点个数,实验结果表明HSDI-tree算法能有效找到最小属性约简且空间压缩能力更好。 相似文献