首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
数值属性离散化方法研究   总被引:3,自引:0,他引:3  
梁红旗 《信息技术》2008,32(5):99-101
关联规则挖掘是数据挖掘研究中的一个重要方面,而数值属性的离散化是数量关联规则挖掘中的关键步骤,讨论了数值属性离散化的算法,以便在实际环境中有更好的应用.  相似文献   

2.
提出了一种标准粗糙集约简时连续属性离散化的新方法.采用标准粗糙集进行属性约简时,要求属性为离散的,而大多数情况下属性是连续的,因此需要进行离散化处理.首先介绍了原有的信息熵算法并指出其局限性;其次,对多类别信息熵进行扩充,将距离因素引入到该信息熵的计算中;最后给出了扩展信息熵计算的两个基本准则,利用证据理论完成信度的上聚焦.仿真显示了该方法的有效性.  相似文献   

3.
粗糙集理论是处理不完备、不确定信息的有效数学工具,是目前数据挖掘、知识工程应用中关键技术之一。粗糙集一般针对离散数据进行处理,实际应用中,数据库中大量存在连续或分散型数据,因此离散化步骤在粗糙集信息系统分析过程中具有重要意义。文章简介粗糙集相关基础知识,从不同角度对现有离散化方法进行了分类,介绍了典型的离散化方法,给出了后续研究思考。  相似文献   

4.
粗糙集理论中一种连续属性离散化算法   总被引:4,自引:3,他引:4  
连续属性离散化一直是机器学习领域中亟待解决的关键问题之一。提出一种基于断点重要性的离散化算法。首先给出粗糙集理论的几个基本概念:决策表、不可分辨关系、信息熵和条件熵,然后对离散化问题进行介绍,给出断点分类的条件熵定义,在此基础上给出了断点选择的粗糙集连续属性离散化算法。仿真结果表明,算法的综合性能优越于文献报道的同类算法。  相似文献   

5.
赵晓霞 《现代电子技术》2007,30(22):197-199
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。  相似文献   

6.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性.  相似文献   

7.
连续属性离散化是粗糙集理论的重要研究内容之一。将差别矩阵应用到连续属性离散化中,充分利用差别矩阵的优点,提出一种基于差别矩阵的粗糙集连续属性离散化算法。为使差别矩阵适应离散化应用中的需要,给出了粗糙集连续属性离散化中差别矩阵的定义。基于该差别矩阵,以候选断点在差别矩阵中的出现频率和断点重要性为启发式信息,对差别矩阵进行化简,直到该差别矩阵为空,即得到所求结果断点,以实现对决策表的离散化,并通过实例证明了该算法的高效性。  相似文献   

8.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。  相似文献   

9.
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力.  相似文献   

10.
食品安全是社会各界日益关注的民生问题,政府部门正在逐步完善监管体制、加大监管力度,构建社会共治的格局.本文针对已经曝光的食品安全事件,经过清洗筛选建立统一规范的数据存储,利用改进的基于信息熵模糊聚类分析算法对其进行数据挖掘,以便发现这些事件中具有象征性的现象以及典型性的安全事件,从而为政府制定管理决策和为民众提高防范意...  相似文献   

11.
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度.  相似文献   

12.
针对联合概率数据关联算法计算量上存在的组合爆炸问题,本文引入最大熵模糊聚类算法实现多目标的数据关联。使用最大熵模糊聚类得到的模糊隶属度表示目标与量测之间的联合互联概率;分析了公共回波对航迹更新的影响,对公共回波的权值进行衰减,对非公共回波的权值进行扩大,避免了航迹合并;此外根据差异因子的特性,给出剔除无效回波的方法,减少了计算量。仿真结果表明,与现有数据关联算法相比,新算法具有更优的跟踪效果。  相似文献   

13.
吴宁博  彭长根  牟其林 《电子学报》2019,47(11):2337-2343
针对差分隐私非交互式多属性关联的合成数据集发布问题,基于信息熵、汉明失真提出了发布数据集隐私度、数据效用、隐私泄露风险的量化方法.首先,利用互信息量分析属性相关度,并以关联依赖图模型表达属性关联.其次,基于图中关键隐私泄露路径构建马尔可夫隐私泄露链,并结合信息熵提出一种关联属性隐私度量模型及方法,可以有效的度量由关联属性引起的隐私泄露量.最后,通过具体实例验证了模型与方法的有效性,并对比分析了该方法的优势.  相似文献   

14.
A Knowledge Reduction Algorithm Based on Conditional Entropy   总被引:1,自引:1,他引:0  
1 IntroductionSomeindustries ,includingtelecommunicationsandcreditcards ,haveinteractiverelationshipwithcustomersthatgeneratemanytransactionrecords,whichmakesdatatobegeneratedandcollectedatanunprecedentedspeed .However,thesedatahavetobeturnedintoknowledg…  相似文献   

15.
在目标搜索领域,合理安排调度序列能有效提高雷达搜索性能。针对相控阵雷达同时多任务需求,提出了一种基于最大信息增益原则的自适应资源调度搜索算法。在目标先验信息引导下,给出重点搜索区域内波位编排方法,采用最大信息增益原则,在满足时间和能量资源的约束条件下,解决重点区域内目标的最优搜索问题。仿真结果表明,与传统相控阵雷达基于顺序搜索方式相比,该算法能快速发现目标并有效提高搜索数据率和能量利用率,在工程应用中证明该方法是行之有效的。  相似文献   

16.
基于信息熵的一种传感器管理算法   总被引:16,自引:3,他引:16       下载免费PDF全文
通过对目标搜索区域不确定性定量描述的信息熵及信息熵变化而产生的信息增量,本文提出了一种多传感器对多目标进行检测与分类的优化算法,即针对每一检测单元计算该时刻的信息熵及预测下一时刻的信息熵,产生信息增量最大的检测单元就是下一次要搜索的单元.仿真结果证明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号