共查询到16条相似文献,搜索用时 78 毫秒
1.
数值属性离散化方法研究 总被引:3,自引:0,他引:3
关联规则挖掘是数据挖掘研究中的一个重要方面,而数值属性的离散化是数量关联规则挖掘中的关键步骤,讨论了数值属性离散化的算法,以便在实际环境中有更好的应用. 相似文献
2.
3.
粗糙集理论是处理不完备、不确定信息的有效数学工具,是目前数据挖掘、知识工程应用中关键技术之一。粗糙集一般针对离散数据进行处理,实际应用中,数据库中大量存在连续或分散型数据,因此离散化步骤在粗糙集信息系统分析过程中具有重要意义。文章简介粗糙集相关基础知识,从不同角度对现有离散化方法进行了分类,介绍了典型的离散化方法,给出了后续研究思考。 相似文献
4.
粗糙集理论中一种连续属性离散化算法 总被引:4,自引:3,他引:4
连续属性离散化一直是机器学习领域中亟待解决的关键问题之一。提出一种基于断点重要性的离散化算法。首先给出粗糙集理论的几个基本概念:决策表、不可分辨关系、信息熵和条件熵,然后对离散化问题进行介绍,给出断点分类的条件熵定义,在此基础上给出了断点选择的粗糙集连续属性离散化算法。仿真结果表明,算法的综合性能优越于文献报道的同类算法。 相似文献
5.
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。 相似文献
6.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性. 相似文献
7.
连续属性离散化是粗糙集理论的重要研究内容之一。将差别矩阵应用到连续属性离散化中,充分利用差别矩阵的优点,提出一种基于差别矩阵的粗糙集连续属性离散化算法。为使差别矩阵适应离散化应用中的需要,给出了粗糙集连续属性离散化中差别矩阵的定义。基于该差别矩阵,以候选断点在差别矩阵中的出现频率和断点重要性为启发式信息,对差别矩阵进行化简,直到该差别矩阵为空,即得到所求结果断点,以实现对决策表的离散化,并通过实例证明了该算法的高效性。 相似文献
8.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。 相似文献
9.
陈浩 《微电子学与计算机》2011,28(11):106-109
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力. 相似文献
10.
辜萍萍 《智能计算机与应用》2021,11(5):188-192
食品安全是社会各界日益关注的民生问题,政府部门正在逐步完善监管体制、加大监管力度,构建社会共治的格局.本文针对已经曝光的食品安全事件,经过清洗筛选建立统一规范的数据存储,利用改进的基于信息熵模糊聚类分析算法对其进行数据挖掘,以便发现这些事件中具有象征性的现象以及典型性的安全事件,从而为政府制定管理决策和为民众提高防范意... 相似文献
11.
郑燕玲 《微电子学与计算机》2011,28(8)
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度. 相似文献
12.
13.
14.
A Knowledge Reduction Algorithm Based on Conditional Entropy 总被引:1,自引:1,他引:0
1 IntroductionSomeindustries ,includingtelecommunicationsandcreditcards ,haveinteractiverelationshipwithcustomersthatgeneratemanytransactionrecords,whichmakesdatatobegeneratedandcollectedatanunprecedentedspeed .However,thesedatahavetobeturnedintoknowledg… 相似文献
15.
在目标搜索领域,合理安排调度序列能有效提高雷达搜索性能。针对相控阵雷达同时多任务需求,提出了一种基于最大信息增益原则的自适应资源调度搜索算法。在目标先验信息引导下,给出重点搜索区域内波位编排方法,采用最大信息增益原则,在满足时间和能量资源的约束条件下,解决重点区域内目标的最优搜索问题。仿真结果表明,与传统相控阵雷达基于顺序搜索方式相比,该算法能快速发现目标并有效提高搜索数据率和能量利用率,在工程应用中证明该方法是行之有效的。 相似文献