首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
视觉属性能够展现人们识别事物时所定义的语义概念,但现有的视觉识别工作往往忽略了属性在分类器设计中能作为中间媒介层的作用.本文给出一种将属性和事物类别同时用于构建分类器的方法.分析了传统多类分类器、直接类别相关模型、间接属性预测模型、直接属性预测模型的特点.在动物和室外场景数据集上的实验证明,利用属性进行分类器学习对于提高传统多目标分类和迁移学习的性能都具有很好的帮助.  相似文献   

2.
以属性论为理论依据,分析了个性数据属性与属性重心剖分模型的关系,在属性线性坐标系中表示数据属性集对象重心点,从而得到聚类程度函数和聚类算法。该模型有效地描述了个性化数据属性间的语义关系。  相似文献   

3.
在现实应用中许多数据往往是动态变化的,静态的属性约简算法处理此类数据需消耗大量的计算时间和存储空间。针对集值决策信息系统中数据的动态变化情况,通过引入条件信息量和属性重要性概念,提出了一种启发式的动态属性约简算法,当新的属性集增加到决策信息系统时,算法能够利用原系统的属性约简结果,快速更新属性集增加后的属性约简,并对更新后的属性约简中可能存在的冗余属性进行反向剔除,保持了知识获取的简洁,提高了算法的计算效率。最后,通过实例验证进一步分析了算法的有效性和可行性。  相似文献   

4.
属性选择是提高分类器性能的一种有效的方法.然而已有的属性选择算法要么假设数据无噪声,要么没有考虑属性间的交互作用,不能用于数据集中既有噪声又存在属性交互作用的情况.提出一种基于信息熵的属性选择算法,该算法用条件熵来评价属性子集对目标概念的描述能力,利用后向删除搜索策略进行属性选择.同时,根据不一致实例和关联规则中提升度的概念,给出噪声数据的定义和识别方法.该算法和典型的属性选择算法在10个UCI标准数据集上的对比实验结果表明,提出的算法在减少属性数量的同时将C4.5和NaiveBayes的平均分类精度分别提高了2.77%和3.42%.  相似文献   

5.
本文讨论了有关等价属性集的一些性质,提出了准等价属性集和基本等价属性集的概念。在此基础上给出了一种求等价属性集的算法。  相似文献   

6.
随着计算机网络的发展,多个形式背景分布存储在不同的网络节点,研究合成背景的属性约简就显得十分重要。提出了一种多背景纵向合成的面向对象概念格的属性约简方法,给出了面向对象概念格的属性近似算子真子集的定义,并给出了各子形式背景和合成形式背景的属性特征间的关系,在此基础上,给出了合成形式背景的属性近似算子真子集、子形式背景的属性近似算子真子集和属性等价类间的关系,并利用它们间的关系给出了合成背景的各种属性判别的充要条件,进而给出了合成背景属性约简的构造算法。  相似文献   

7.
自上而下的关联规则采掘方法   总被引:1,自引:0,他引:1  
1.前言在数据集中采掘关联规则是数据采掘的一个重要内容,[2]中提出了一种自底向上的数据采掘方法,即把数据集的各个属性从概念层次的最底层向高层进行“泛化”,但这种方法有二个缺点:首先,它的每一层都有一个阈值,但这些阈值之间是密切相关的;并且,对于不同数据集,这些阈值之间的关系也不同。在数据采掘的过程中,要调整这些阈值以取  相似文献   

8.
基于模糊概念层的核属性集确定方法及其应用   总被引:1,自引:1,他引:0  
核属性集的确定是从海量数据中发现决策规则的重要步骤。该文在结合粗糙集理论和层次聚类方法的基础上,改进了已有的模糊概念层核属性集确定方法,不仅能运用模糊概念层方法对原始数据进行模糊化处理,排除边缘数据的干扰作用,还可减少噪声数据的干扰作用以进一步简化可区分矩阵,得出核属性集且使得生成的判定规则可信度更高。最后以汽车生产厂商汽车样本各项指标实测数据为例论证了算法的有效性和实用性。  相似文献   

9.
一种新的属性集依赖度研究   总被引:8,自引:0,他引:8  
孟庆全  梅灿华 《计算机应用》2007,27(7):1748-1750
提出了新的属性集依赖度的概念,给出了属性集依赖度的求解步骤和算法。针对单一属性依赖度与属性集依赖度的差别,讨论了属性集依赖度的意义,得出属性集依赖度更加可信的结论。  相似文献   

10.
约简是粗集理论的重要概念,由定义计算约简是一个典型的NP问题且由于约简的不唯一,在面对大数据集或高维数据集问题时获得的属性集往往并非是最小的属性约简集。文中针对Rough sets理论的属性约简进行了研究。研究了通过可辨识矩阵求得属性约简集,利用Rough sets与灰色理论相结合,提出一种属性约简的启发式算法,拟合结果表明本约简算法合有效。  相似文献   

11.
一种基于有序属性决策系统分类规则提取策略   总被引:1,自引:0,他引:1  
分类规则的精度取决于分类算法的构造,论文在综合分析基本粗糙集合概念及其约简算法的基础上,阐述了一种基于准则的有序属性决策系统的数据挖掘算法.为此首先介绍了基于有序属性决策系统的集合表达,然后利用有序属性决策系统中准则集与属性集的基本特征构造上下近似扩展模型,得到准则集决策系统的四个相关参数.并进一步提出相应的数据约简与分类规则提取算法。最后给出了用此算法约简有序属性决策系统的算例,实验结果表明此方法挖掘出的规则简练,更具合理性和可靠性。  相似文献   

12.
贝叶斯分类方法因具有严密的数学理论基础,于是成为一种简单而有效的数据挖掘方法;然而,贝叶斯分类器要求——条件独立性假设和每个属性权值为1,这极大降低了贝叶斯分类器的性能;针对贝叶斯分类器的局限性,文章提出了一种优化的贝叶斯分类算法;文中,首先利用粗糙集理论对待分类数据集进行属性约简,删除冗余属性;然后给出了属性权值的计算方法和公式,目的在于更准确地描述数据集的重要性和相关性;同时,通过weka3.6.2工具,以UCI机器学习数据库中的数据集为测试数据,进行了对比测试;实验结果表明:OBCA具有较高的分类准确率。  相似文献   

13.
针对贴片机的数据挖掘课题中,关联规则生成规则数较多而不易于分析的问题,研究了单决策属性作为规则后件的方法,对实际应用中存在条件约束的情况进行了分析,提出了基于决策属性的关联规则挖掘优化算法。应用结果表明这样得到的规则简洁明确,规则具有实用价值,并且频繁集优化的效果显著,达到了快速挖掘的目的。  相似文献   

14.
S-粗集(singular rough sets)是把动态特征引入到Z.Pawlak粗集中对其加以改进而提出的,S-粗集具有动态特征.S-粗集具有3种形式:单向S-粗集(one direction singular rough sets)、单向S-粗集对偶(dual of one direction singular rough sets)与双向S-粗集(two direction singular rough sets);在一定条件下,单向S-粗集、单向S-粗集对偶与双向S-粗集被还原成Z.Pawlak粗集.利用单向S-粗集和单向S-粗集对偶给出具有属性析取特征的动态数据智能挖掘与应用;属性析取是数据具有的逻辑特征之一.主要结果是:利用单向S-粗集、单向S-粗集对偶结构,给出属性析取萎缩-扩张特征的动态数据生成与它的属性析取萎缩-扩张关系;给出数据推理与推理模型;利用数据推理给出动态数据智能挖掘定理;利用这些理论结果,给出动态数据智能挖掘-智能认知的应用.  相似文献   

15.
Attribute reduction is viewed as an important preprocessing step for pattern recognition and data mining. Most of researches are focused on attribute reduction by using rough sets. Recently, Tsang et al. discussed attribute reduction with covering rough sets in the paper (Tsang et al., 2008), where an approach based on discernibility matrix was presented to compute all attribute reducts. In this paper, we provide a new method for constructing simpler discernibility matrix with covering based rough sets, and improve some characterizations of attribute reduction provided by Tsang et al. It is proved that the improved discernibility matrix is equivalent to the old one, but the computational complexity of discernibility matrix is relatively reduced. Then we further study attribute reduction in decision tables based on a different strategy of identifying objects. Finally, the proposed reduction method is compared with some existing feature selection methods by numerical experiments and the experimental results show that the proposed reduction method is efficient and effective.  相似文献   

16.
王晓鹏 《计算机仿真》2020,37(1):234-238
对区间值属性数据集进行挖掘,可以有效分析出数据之间的关系。针对现有数据挖掘方法未对大规模数据进行聚类,导致挖掘过程占据内存大,挖掘精度低的问题,提出了一种新的区间值属性数据集挖掘算法。对问题定义、数据准备、数据提取、模式预测和数据聚类等模块进行详细分析,完成区间值属性数据聚类。根据聚类结果,将区间值属性数据分成多个数据集,挑选出能够支持最小支持度的项目集,将这些项目集作为频繁项集,进而提取出数据集之间的关联规则,将关联规则融入数据计算步骤,完成数据挖掘。为验证算法效果,进行仿真,结果表明,相较于传统挖掘算法,所提挖掘算法占用容量更小,挖掘精度更高。  相似文献   

17.
针对Apriori算法进行多值属性关联规则挖掘时效率低下的问题,提出量化Apriori算法.利用多值属性数据特点改变项集存储格式,采用类似矩阵的数据结构存储项集,提高遍历数据库时统计计数的速度,使用类似矩阵的加法运算改进连接操作,减少无效候选项集的产生.实验结果表明,相比Apriori算法,该算法执行效率有较大提高.  相似文献   

18.
谢印宝  张佑生 《计算机工程》2000,26(12):150-151,154
在大数据库中确定关键条件属性集,是使用基于粗集理论的集合论生成分类规则算法的重要步骤。该文在简述分类规则形成算法的基础上,对确定关键条件属性集的模糊聚类算法进行了详细的讨论,并给出该方法应用的一个实例。  相似文献   

19.
两实例的距离或相似性度量在数据挖掘和机器学习中扮演着重要的角色。常用的距离度量方法主要适用于数值数据,针对分类数据,本文提出一种数据驱动的相似性度量方法。该方法利用属性值与类标签的信息,将属性值的类条件概率结合信息论来度量分类数据的相似性。为了与已提出的相似性度量方法作比较,把各度量方法与k最近邻算法结合,对多个分类数据集进行分类,通过十折交叉验证比较结果的错误率。实验表明该度量结合k最近邻方法使分类具有较低的错误率。  相似文献   

20.
讨论了在多值属性关系中进行关联规则挖掘的应用特点,提出利用数据整理和数值编码的方式对关联 规则挖掘算法进行优化。将目标数据属性按其在算法中的作用划分,并分别进行转换和编码;然后对数据先进 行聚类,再在聚类结果中发掘频繁项目集;最后利用聚类后关联规则快速更新算法获取关联规则。算法分析和 实验结果表明,该算法比传统的关联规则挖掘算法更有效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号