共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
一种不完备信息系统的直接约简方法 总被引:9,自引:1,他引:9
目前已有基于容差关系、相似关系、限制容差关系等的扩充rough集理论,但仅仅是提出了一些针对以上某种模型的属性约简算法,在此提出从离散化到规则匹配的一系列不完备信息系统的约简处理方法,该方法可以适用于各种rough集扩充模型,并且对完备信息系统和不完备信息系统是统一的. 相似文献
3.
提出了一种基于覆盖粗糙集理论,利用最大一致块技术进行不完备信息系统约简的方法。在证明利用最大一致块技术生成的相容类构成论域的最简覆盖基础上,利用覆盖粗糙集理论对已利用最大一致块技术进行属性约简的信息系统进行属性值约简,并提出一种新的约简算法。 相似文献
4.
提出了一种基于覆盖粗糙集理论,利用最大一致块技术进行不完备信息系统约简的方法。在证明利用最大一致块技术生成的相容类构成论域的最简覆盖基础上,利用覆盖粗糙集理论对已利用最大一致块技术进行属性约简的信息系统进行属性值约简,并提出一种新的约简算法。 相似文献
5.
不完备信息系统的粒计算方法 总被引:1,自引:0,他引:1
粒计算是一种基于问题概念空间划分的新的智能计算理论和方法.不完备信息系统的直接处理也是粗集研究的一个重要内容.本文结合粒计算的处理方法给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗集中的属性约简问题,提出了不完备信息系统在粒表示下属性必要性的判定条件,并给出了严格的证明. 相似文献
6.
7.
不完备信息系统中一种拓展粗糙集模型* 总被引:1,自引:1,他引:0
以同时具有遗漏型和缺席型未知属性值的不完备信息系统为研究对象,提出了一种使用参数进行控制的二元关系以及相应的粗糙集模型,将这种拓展粗糙集模型与不完备信息系统中现有的几种拓展粗糙集模型进行了对比研究。对一不完备信息系统进行了实例分析,以说明新提出的二元关系的有效性。 相似文献
8.
对于不完备信息系统,通过引入一种标准化的距离函数和相容阈值,提出了一种相容关系,给出了基于相容关系的上下近似的定义,讨论了相容阈值的取值。 相似文献
9.
针对混合值不完备信息系统,提出了基于邻域联系度的拓展粗糙集模型。首先定义了一种邻域联系度容差关系,然后通过所确定出的最大相容类得到了上、下近似集,并证明了所得到的近似集是基于联系度容差关系得到的近似集的一种推广和改进,最后进行了实例分析。 相似文献
10.
以同时具有遗漏型和丢失型未知属性值的广义不完备信息系统为研究对象,定义一种用于分类的[α]程度限制优势关系,提出一种基于[α]程度限制优势关系的拓展粗糙集模型,并给出其上、下近似性质。通过一个教师教学质量评估实例,说明这种模型在广义不完备信息系统中处理模糊和不确定知识是有效和可行的。 相似文献
11.
统计关系学习研究进展 总被引:4,自引:0,他引:4
统计关系学习是人工智能领域的一个新研究热点,它将关系表示、似然性理论和机器学习相结合,能更好地解决现实世界中复杂的关系数据问题,在生物信息学、web导航、社会网、地理信息系统和自然语言理解等领域有着重要的应用.首先对统计关系学习的研究内容以及研究任务进行了介绍和总结,然后根据概率表示和推理机制的不同,对当前的统计关系学习方法进行了分类,并对各类方法进行了详细介绍,最后讨论了当前统计关系学习存在的问题,并指出了今后研究和发展的方向. 相似文献
12.
具有丢失数据的可分解马尔可夫网络结构学习 总被引:14,自引:0,他引:14
具有丢失数据的可分解马尔可夫网络结构学习是一个重要而困难的研究课题,数据的丢失使变量之间的依赖关系变得混乱,无法直接进行可靠的结构学习.文章结合最大似然树和Gibbs抽样,通过对随机初始化的丢失数据和最大似然树进行迭代修正一调整,得到修复后的完整数据集;在此基础上基于变量之间的基本依赖关系和依赖分析思想进行可分解马尔可夫网络结构学习,能够避免现有的丢失数据处理方法和可分解马尔可夫网络结构学习方法存在的效率和可靠性低等问题.试验结果显示,该方法能够有效地进行具有丢失数据的可分解马尔可夫网络结构学习. 相似文献
13.
数据库索引是关系数据库系统实现快速查询的有效方式之一.智能索引调优技术可以有效地对数据库实例进行索引调节,从而保持数据库高效的查询性能.现有的方法大多利用了数据库实例的查询日志,它们先从查询日志中得到候选索引,再利用人工设计的模型选择索引,从而调节索引.然而,从查询日志中产生出的候选索引可能并未实际存在于数据库实例中,因此导致这些方法不能有效地估计这类索引对于查询的优化效果.首先,设计并实现了一种面向关系数据库的智能索引调优系统;其次,提出了一种利用机器学习方法来构造索引的量化模型,根据该模型,可以准确地对索引的查询优化效果进行估计;接着设计了一种高效的最优索引选择算法,实现快速地从候选索引空间中选择满足给定大小约束的最优的索引组合;最后,通过实验测试不同场景下智能索引调优系统的调优性能.实验结果表明,所提出的技术可以在不同的场景下有效地对索引进行优化,从而实现数据库系统查询性能的提升. 相似文献
14.
目前主要基于EM算法和打分-搜索方法进行具有丢失数据的贝叶斯网络结构学习,算法效率较低,而且易于陷入局部最优结构.针对这些问题,建立了一种新的具有丢失数据的贝叶斯网络结构学习方法.首先随机初始化未观察到的数据,得到完整的数据集,并利用完整数据集建立最大似然树作为初始贝叶斯网络结构,然后进行迭代学习.在每一次迭代中,结合贝叶斯网络结构和Gibbs sampling修正未观察到的数据,在新的完整数据集的基础上,基于变量之间的基本依赖关系和依赖分析思想调整贝叶斯网络结构,直到结构趋于稳定.该方法既解决了标准Gi 相似文献
15.
16.
传统方法多数采用机器学习算法对数据进行清洗.这些方法虽然能够解决部分问题,但存在计算难度大、缺乏充足的知识等局限性.近年来,随着众包平台的兴起,越来越多的研究将众包引入数据清洗过程,通过众包来提供机器学习所需要的知识.由于众包的有偿性,研究如何将机器学习算法与众包有效且低成本结合在一起是必要的.提出了两种支持基于众包的数据清洗的主动学习模型,通过主动学习技术来减少众包开销,实现了对给定的数据集基于真实众包平台的数据清洗,最大程度减少成本的同时提高了数据的质量.在真实数据集上的实验结果验证了所提模型的有效性. 相似文献
17.
We propose an effcient approach for classifying insu±cient dataset with missing data (incomplete data) with group di?erence detection. Specifically, missing data in an insuffcient dataset are first completed with the parimputation strategy. And then, the insuffcient dataset is grouped by contrasting with a known dataset (transfer learning). Finally, for assessing the quality of the induced models, empirical likelihood (EL) inference is used to estimate the confidence intervals of structural differences between the insuffcient dataset and the known dataset. In such a way of mining, classifying incomplete data can be beneficial to industries as it will provide easier and smarter use of information. This will include evaluating a new medical product by detecting differences between the new product
and an old one for pharmaceutical companies and, identifying frauds by detecting abnormal operations. To experimentally illustrate the benefits, we evaluate the proposed approach using UCI datasets, and demonstrate that our method works much better than the boot-strap resampling method on, for example, distinguishing spam from non-spam emails; and the benign breast cancer from the malign one. 相似文献
18.
基于关系数据库的对象数据管理方法研究 总被引:3,自引:0,他引:3
面向对象方法在许多领域中已经得到了广泛应用 .对象描述方法可以很方便地描述领域中具有复杂结构的数据 ,但这些复杂数据的存储问题还有待妥善解决 .在数据存储管理方面 ,关系数据库系统一直处于主导地位 .本文提出了一种将对象模型和关系模型有机结合在一起的方法 .该方法将数据存储功能从领域数据对象中分离出来 ,采用专门的对象管理器来处理复杂的对象数据与关系数据库的交互问题 .该方法已经被用于海洋传播模型数据库管理系统的设计开发中 ,并取得较好的效果 相似文献
19.
20.
A new algorithm is developed to train feed-forward neural networks for non-linear input-to-output mappings with small incomplete data in arbitrary distributions. The developed Training-EStimation-Training (TEST) algorithm consists of 3 steps, i.e., (1) training with the complete portion of the training data set, (2) estimation of the missing attributes with the trained neural networks, and (3) re-training the neural networks with the whole data set. Error back propagation is still applicable to estimate the missing attributes. Unlike other training methods with missing data, it does not assume data distribution models which may not be appropriate for small training data. The developed TEST algorithm is first tested for the Iris benchmark data. By randomly removing some attributes from the complete data set and estimating the values latter, accuracy of the TEST algorithm is demonstrated. Then it is applied to the Diabetes benchmark data, of which about 50% contains missing attributes. Compared with other existing algorithms, the proposed TEST algorithm results in much better recognition accuracy for test data. 相似文献