共查询到20条相似文献,搜索用时 62 毫秒
1.
利用时间复杂度为O(|C||U|求U/C的快速算法,设计了一种基于属性重要度的上近似约简快速启发式算法,将时间复杂度降为O(|C|2|D||U|),该算法在处理拥有海量数据的决策表时,具有高效性. 相似文献
2.
属性核计算是Rough集理论中的一个重要研究内容.将分治法的思想溶入Rough集算法中,在决策表的属性集上,利用分治法对论域进行划分,给出了基于分治法的正区域计算方法,其时间复杂度分别为D(|U|×|C|);在此基础上,给出了基于分治法的属性核计算方法,其时间复杂度为O(|U|×|C|2).两个算法的时间复杂度都保持了与|U|的线性关系.实验结果表明:文中的算法不仅能高效地处理UCI数据集,且能适合大数据集的处理. 相似文献
3.
基于区分对象对集的高效属性约简算法 总被引:5,自引:0,他引:5
给出区分对象对集的定义和基于区分对象对集的属性约简的定义,证明该定义与基于正区域的属性约简定义等价.由于求区分对象对集时,要求出U/C,故设计一个高效的求U/C的算法,其时间复杂度降为O(| C | | U |).进而提出一个基于区分对象对集的高效属性约简算法,其时间和空间复杂度分别降为O(|C| | U |)+O(| C| | U/C|2)和O(| U |)+O(| U/C |2).用1实例说明该算法的高效性. 相似文献
4.
一种快速计算HU差别矩阵的属性约简算法 总被引:7,自引:0,他引:7
在已有的基于HU差别矩阵的属性约简算法中,一般是以差别矩阵中的元素作为启发信息而设计的,其时间复杂度为O(|C|2|U|2).为降低该属性约简算法的时间复杂度, 首先引入简化决策表的定义,并设计了一个求简化决策表的算法,其时间复杂度为O(|C||U|).然后在简化决策表的基础上,定义了差别区域,并给出基于差别区域的属性约简定义,同时证明了基于差别区域的属性约简与基于差别矩阵的属性约简等价.在此基础上,以快速缩小简化决策表的搜索空间为目的,定义了一个新的、较为合理的、度量属性重要性的公式,并给出了它的递归计算方法,其时间复杂度为O(U/C|).最后以属性重要性为启发信息,设计了一个基于差别矩阵的快速属性约简算法,其时间复杂度降为max(O(|C||U|,O(|C|2|U/C|)),并用一个实例说明了新算法的高效性.理论分析与实验表明,新算法具有较好的扩展性. 相似文献
5.
一个有效的基于信息熵的启发式属性约简算法 总被引:4,自引:1,他引:3
基于信息熵的属性约简算法都是以信息熵为启发信息设计的,其时间复杂度并不理想.为降低算法的时间复杂度,引入简化决策表的定义,设计了一个求简化决策表的算法,其时间复杂度为O(|C||U|).以快速缩小简化决策表的搜索空间为目的,定义了一个新的、较为合理的、度量属性的信息量,并给出了它的递归计算方法,其时间复杂度为P(| U/C|).同时证明了简化决策表上基于信息量的属性约简与原决策表上基于信息熵的属性约简是等价的.然后以属性的信息量为启发信息,设计了一个基于信息熵的快速属性约简算法,其时问复杂度降为max(O(|C||U|),O(|C|2|U/C|)),并用一个实例说明算法的有效性,实验结果表明新算法不仅具有高效性,且能处理大型决策表. 相似文献
6.
改进的快速属性约简算法 总被引:10,自引:4,他引:6
属性约简是决策表信息系统中一个重要操作.目前最高效的算法是徐章艳给出的RedueBaseSig算法,其时间复杂度为max{O(|C||U|),D(|C|2|U|)},但在某些情况下,该算法求得的并不是约简.文中分析了徐章艳算法的局限性.并提出改进的快速属性约简算法.该算法优化了等价类划分和正区域求解,以核属性为初始约简集,不断将重要性大的属性加入约简集中.在最坏情况下改进后算法的时间复杂度为O(|C|2|U|);而且实验结果表明,该算法是正确的、高效的. 相似文献
7.
8.
为了解决基于差别矩阵属性约简的计算效率问题,首先以计数排序的思想设计了一个新的计算U/C的高效算法,其时间复杂度降为O(|C||U|)。其次分析了基于差别矩阵的属性约简算法的不足,提出了改进的差别矩阵的定义,利用快速计算核属性算法生成的核属性和出现频率最多的属性来降低差别矩阵的大小,并设计了基于改进的差别矩阵的快速属性约简算法,证明了该新算法的时间复杂度和空间复杂度分别被降为max(O|C|2Σ0≤i相似文献
9.
10.
11.
针对朴素贝叶斯算法存在的三方面约束和限制,提出一种数据缺失条件下的贝叶斯优化算法。该算法计算任两个属性的灰色相关度,根据灰色相关度完成相关属性的联合、冗余属性的删除和属性加权;根据灰色相关度执行改进EM算法完成缺失数据的填补,对经过处理的数据集用朴素贝叶斯算法进行分类。实验结果验证了该优化算法的有效性。 相似文献
12.
属性是一种用于描述概念和鉴别概念的特殊知识。属性名称是表示属性的专有名词。该文提出了一种基于前后缀迭代的方法,从Web网页中获取概念的属性名称。该方法的每一次迭代分为两个阶段: (1) 从现有种子属性集中选择合适的前后缀,构造词汇-句法模式,从Web网页中提取候选属性;(2) 采用基于相似性的验证模型对候选属性进行验证,以扩充现有属性集合。该文提出了一组验证模型对候选属性进行验证,比较各个模型的优缺点,并在地域类和商业主体类概念上分别得到了平均92.9%和90.7%的准确率,以及对原有种子属性集合近100倍的扩充率。 相似文献
13.
信息系统中的属性约简是粗糙集知识发现的一个重要步骤。致力于研究一个信息系统中的特征选择、删除冗余属性。新的算法从属性重要性出发,采用迭代特征选择的标准,使得选择特征属性集不断缩小,获得信息系统的约简。通过实验证明该方法可行,有效。 相似文献
14.
以形式化语言给出了本质属性、附属属性、限定性属性等术语的定义,研究了它们的性质与内在联系,给出了属性集的一种新的分类方法。结合对属性子集的一种新运算,特别讨论了本质属性的特征,并以此对IDEF5中种类的概念做了形式化修正。同时,研究发现,在本质属性为多个时,只需保留一条,其他任何一条本质属性既是可约属性也是不必要属性,而本质属性的判定简便易行,在利用相关算法进行属性约简之前可以先剔除部分属性。最后,以实例表明了这样预处理的优越性。 相似文献
15.
文献[9]给出了一种决策表的代数约简快速属性约简算法,但有时得不到正确的结果,首先给出算例指出其不足,然后给出改进的属性重要性及其快速属性约简算法,它能保证得到正确的代数约简结果。数值算例也验证了其正确性。 相似文献
16.
基于关系数据库的多维数据存储模型 总被引:4,自引:1,他引:3
本文介绍了一种以关系数据库为最终数据库存储管理系统,通过在数据管理人员与关系数据库之间建立一个多维数据库存储管理支持模块,实现用户对多维数据和对象的存储管理的方法。阐述了其中关键的算法思路,给出应用实例,并作出评价。 相似文献
17.
目前,已有许多种构建决策树的方法。大多数是基于信息熵的,例如,ID3算法,Min-Ambiguity算法以及它们的变异。文中提出了一种新的启发式算法,它是基于属性对于分类的重要程度的。在选择扩展属性时,有两个选择,即敏感属性和不敏感属性,通常人们习惯选择敏感属性而忽视了不敏感属性。文章主要将其应用到了几个具有符号型属性类分明的数据库。根据对几个数据库所做的实验,对这两种方法从几方面进行了比较,指出了他们各自的利弊所在。 相似文献
18.
一种基于零值原则的属性约简方法 总被引:1,自引:0,他引:1
根据Guan等提出的完备信息系统下矩阵约简算法,提出一种改进的属性约简计算方法。该方法根据矩阵的运算特点,通过引入唯一零值概念,使得计算过程更为简易。证明了它与区分矩阵下属性约简的等价性,最后将该方法运用到协调决策表中,并用实例对此进行了说明。 相似文献
19.
针对基于属性访问控制中复杂的属性工程,在以太坊底层使用的数据存储结构的MPT(Merkle Patricia tree)方法基础上进行部分安全性扩展,将离散属性建模成统一的MPT属性集,然后通过默克尔证明方法确保属性集的完整性。为了保证属性隐私不会被泄露以及增强MPT属性体系在分布式环境下的安全性,使用公开密钥体制的椭圆曲线加密算法对属性值进行处理。此外,将MPT属性集以数据库的方式存储,实现动态的属性操作。理论分析和实验结果表明该策略能解决属性工程的完整性和安全性问题,也使得基于属性的访问控制在分布式环境中易于实施。 相似文献
20.
提出一种基于粗糙集属性重要性的属性约简算法。该算法以所有条件属性为初始约简集合,以属性重要性为迭代准则,通过逐步缩减来求取约简。同时给出了该算法的时间复杂度分析,并举例验证了所提出算法的有效性和实用性。 相似文献