首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
在文献[1]的基础上,得到了离散格的表示定理.进一步证明了在离散格到划分格的映射下交运算可以保持运算,而并运算不能保持运算,因此该映射不是同态映射.根据离散化后得到的对象域划分定义了离散化方案之间的等价关系,证明了随着离散化等价类[DR]的加粗,离散化方案对应的正区域下降,而条件信息熵上升.最后分析了另外两种离散格搜索算法.  相似文献   

2.
一种新的信息熵属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
给出一个区分对象对的属性约简定义,同时证明该属性约简的定义与基于信息熵的属性约简的定义是等价的。为求出区分对象对集,首先给出了一个快速求简化决策表的算法,其时间复杂度为O(|C||U|)。然后在简化决策表的基础上,设计了基于区分对象对集的信息熵属性约简算法,其时间复杂度和空间复杂度分别为O(|C||U|)+O(|C||U/C|2)和O(|U/C|2)+O(|U|),最后用一个实例说明了新算法的高效性。  相似文献   

3.
定义离散化方案之间的偏序关系以及交、并运算,将一个信息表的各种离散化方案组织成一个格空间,称为离散格.分析了离散格与划分格之间的关系,证明了离散格是一个布尔代数,而划分格不是布尔代数.分析了一类离散化算法,指出这类算法的求解过程正是对离散格的搜索过程.  相似文献   

4.
目前,基于基数排序的等价类划分算法有较低的时间复杂度但存在以下不足:属性值跳跃性大时会产生大量空队列;排序后仍需O(|PU|)的时间才实现划分,求出等价类,排序没能发挥应有作用。为此,设计了一种新算法,通过属性值映射避免大量空队列产生,通过增加一个记录等价类长度信息的计数数组,排序后仅需O(|U|)就可实现划分,求出等价类。整个算法时间复杂度为O(|CU|),空间复杂度为O(|U|),为求等价类划分提供了一个新的解决办法。  相似文献   

5.
一个计算Skowron差别矩阵核的新算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为提高基于Skowron差别矩阵的求核算法的效率,引入简化决策表的定义,给出了简化Skowron差别矩阵和相应核的定义,证明了新核与基于Skowron差别矩阵的核是一致的。提出一个基于Skowron差别矩阵的快速求核新算法,其时间复杂度和空间复杂度分别降为[max{O(|C||U/C|2),O(|C||U|)}]和[max{O(|U|),O(|C|)}]。  相似文献   

6.
目前,求核算法存在以下不足:求得的核与正区域的核不一致,求核算法的时间复杂度和空间复杂度不理想。针对上述问题,给出一种二进制可分辨矩阵的定义及其求核性质,并证明了由该性质获得的核与正区域的核是等价的,然后设计求核算法,该算法的时间复杂度为max{O(|C||U/C|2),O(|C||U|)},空间复杂度为O(|C||U/C|2)。最后实例说明该方法的可行性和有效性。  相似文献   

7.
离散格的一种启发式搜索算法   总被引:1,自引:0,他引:1  
通过定义离散化方案之间的偏序关系以及交、并运算,将各种离散化方案组织成离散格。提出一种搜索离散格的启发式算法,实验表明该算法得到的一致决策表的断点数比已有解更少。  相似文献   

8.
目前,基于不完备决策表的属性约简研究较少。基于信息量的不完备决策表属性约简是一种新的属性约简。由于在该属性约简中,计算相容关系是最主要的计算,也比计算等价关系要难得多。基于信息量的不完备决策表的属性约简算法的时间复杂度一般为O(|C|2|U|2)。为降低其时间复杂度,首先分析了老算法的不足,然后给出了一个效率较好的计算相容类的算法。最后设计了一个新的基于信息量的不完备决策表的属性约简算法,其时间复杂度为O(|C|2|U|2)。  相似文献   

9.
属性约简的效率是粗糙集等软计算理论的核心问题之一。为了提高约简效率,在分析不可分辨关系和基数排序特点的基础上,提出了一种时间复杂度为O(|C||U|)的求核算法。然后,运用改进的属性重要度作为启发信息,得到一种快速的属性约简算法,时间复杂度为O(|C|2|U|)。最后,通过UCI机器学习库中的一些数据集对算法进行测试,证明了算法对大型的数据集进行属性约简的高效性。  相似文献   

10.
基于可分辨矩阵的属性约简算法需要占用大量的存储空间,可分辨矩阵中许多元素项对约简是多余的;并且随着问题规模的增大,该类算法的效率并不理想。针对上述不足,提出一种基于有序差别集的属性约简算法,该算法不需要创建可分辨矩阵和生成多余的元素项,大大降低了存储量和计算量,从而提高了属性约简效率,使算法的时间复杂度和空间复杂度分别降为max{O(|C|2 |U/C|2),O(|C|2|MsCount|)}和O(|MsCount|)。实验表明该算法是有效的、高效的。  相似文献   

11.
概念格理论和粗糙集理论是两种不同的知识表示与知识发现的工具,都已被成功应用于许多领域.粗糙集理论的数据表现方式是信息系统,其研究基础是对象之间的等价关系;概念格理论的数据表现方式是形式背景,其研究基础是一种有序的层次结构--概念格.本文讨论了概念格理论与粗糙集理论之间的基本联系;重点分析了形式概念与等价类之间、概念格与分划之间的关系;证明了概念格与分划之间可以相互转换,给出了转换算法,并用例子加以说明.  相似文献   

12.
基于微粒群优化的连续属性离散化算法   总被引:3,自引:0,他引:3  
连续属性的离散化是粗糙集理论的主要问题之一,也是影响粗糙集理论实用性的瓶颈之一。由于没有最佳离散化形式的统一标准,大多离散化算法采用的启发式带有较强的主观性,也难以得到较满意的离散效果。该文提出了基于微粒群优化的连续属性离散化方法,将各属性的离散化划分点初始化为一群粒子,在保证决策表分类能力不变的情况下,通过粒子间的相互作用寻求理想的离散化划分点,使得决策表引入较少的冲突。实验结果验证了该方法的有效性。  相似文献   

13.
The problem of the logarithmic discretization of an arbitrary positive function (such as the density of states) is studied in general terms. Logarithmic discretization has arbitrary high resolution around some chosen point (such as Fermi level) and it finds application, for example, in the numerical renormalization group (NRG) approach to quantum impurity problems (Kondo model), where the continuum of the conduction band states needs to be reduced to a finite number of levels with good sampling near the Fermi level. The discretization schemes under discussion are required to reproduce the original function after averaging over different interleaved discretization meshes, thus systematic deviations which appear in the conventional logarithmic discretization are eliminated. An improved scheme is proposed in which the discretization-mesh points themselves are determined in an adaptive way; they are denser in the regions where the function has higher values. Such schemes help in reducing the residual numeric artefacts in NRG calculations in situations where the density of states approaches zero over extended intervals. A reference implementation of the solver for the differential equations which determine the full set of discretization coefficients is also described.  相似文献   

14.
提出一种连续属性值域划分的离散化新方法,该方法定义一个新的离散化函数,依据类与属性之间的相互依赖关系选择最优的离散区间列表;此外,采用变精度粗糙集理论合理地控制数据离散化产生的信息丢失,减少分类错误。仿真结果和统计分析表明,提出的方法有较好的C5.0决策树分类能力。  相似文献   

15.
A concept lattice is an ordered structure between concepts. It is particularly effective in mining association rules. However, a concept lattice is not efficient for large databases because the lattice size increases with the number of transactions. Finding an efficient strategy for dynamically updating the lattice is an important issue for real-world applications, where new transactions are constantly inserted into databases. To build an efficient storage structure for mining association rules, this study proposes a method for building the initial frequent closed itemset lattice from the original database. The lattice is updated when new transactions are inserted. The number of database rescans over the entire database is reduced in the maintenance process. The proposed algorithm is compared with building a lattice in batch mode to demonstrate the effectiveness of the proposed algorithm.  相似文献   

16.
决策系统中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值,对后继阶段的机器学习具有重要的意义。首先研究了满足决策系统最优划分的一种计算候选断点集合的算法,然后在基于条件属性重要度和贪心算法的基础上提出了一种确定结果断点子集的新启发式算法。所提出的属性离散算法考虑并体现了粗糙集理论的基本特点和优点,并能取得较理想的连续属性离散化结果。  相似文献   

17.
We propose a notion of deterministic association rules for ordered data. We prove that our proposed rules can be formally justified by a purely logical characterization, namely, a natural notion of empirical Horn approximation for ordered data which involves background Horn conditions; these ensure the consistency of the propositional theory obtained with the ordered context. The whole framework resorts to concept lattice models from Formal Concept Analysis, but adapted to ordered contexts. We also discuss a general method to mine these rules that can be easily incorporated into any algorithm for mining closed sequences, of which there are already some in the literature.  相似文献   

18.
A cocurrent reaction‐advection process represented by a system of first order hyperbolic partial differential equations (PDE's) has a desirable feature of finite impulse response (FIR) that allows easy identification and control. However, this desirable characteristic hasn't been exploited since all of the known finite difference discretization schemes do not preserve this desirable characteristic. In this note, we propose a finite difference discretization scheme that preserves the FIR property.  相似文献   

19.
基于含有多值决策信息的决策形式背景,提出序决策形式背景的概念及其序决策概念格的相关理论,给出序决策概念格的决策规则及规则的置信度与支持度,并讨论决策规则在实际应用中的意义.在此基础上定义保持规则不变的属性约简,同时得到保持序决策概念格结构不变的属性约简方法.最后讨论序决策形式背景保持规则不变的约简与保持格结构不变的约简之间的关系.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号