首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
数值属性离散化方法研究   总被引:3,自引:0,他引:3  
梁红旗 《信息技术》2008,32(5):99-101
关联规则挖掘是数据挖掘研究中的一个重要方面,而数值属性的离散化是数量关联规则挖掘中的关键步骤,讨论了数值属性离散化的算法,以便在实际环境中有更好的应用.  相似文献   

2.
提出了一种标准粗糙集约简时连续属性离散化的新方法.采用标准粗糙集进行属性约简时,要求属性为离散的,而大多数情况下属性是连续的,因此需要进行离散化处理.首先介绍了原有的信息熵算法并指出其局限性;其次,对多类别信息熵进行扩充,将距离因素引入到该信息熵的计算中;最后给出了扩展信息熵计算的两个基本准则,利用证据理论完成信度的上聚焦.仿真显示了该方法的有效性.  相似文献   

3.
粗糙集理论是处理不完备、不确定信息的有效数学工具,是目前数据挖掘、知识工程应用中关键技术之一。粗糙集一般针对离散数据进行处理,实际应用中,数据库中大量存在连续或分散型数据,因此离散化步骤在粗糙集信息系统分析过程中具有重要意义。文章简介粗糙集相关基础知识,从不同角度对现有离散化方法进行了分类,介绍了典型的离散化方法,给出了后续研究思考。  相似文献   

4.
粗糙集理论中一种连续属性离散化算法   总被引:4,自引:3,他引:4  
连续属性离散化一直是机器学习领域中亟待解决的关键问题之一。提出一种基于断点重要性的离散化算法。首先给出粗糙集理论的几个基本概念:决策表、不可分辨关系、信息熵和条件熵,然后对离散化问题进行介绍,给出断点分类的条件熵定义,在此基础上给出了断点选择的粗糙集连续属性离散化算法。仿真结果表明,算法的综合性能优越于文献报道的同类算法。  相似文献   

5.
赵晓霞 《现代电子技术》2007,30(22):197-199
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。  相似文献   

6.
为解决经典粗糙集理论在处理决策表离散化时规则数多、准确率低的问题,文中提出基于贪心算法和属性值分布率相结合的二次离散化方法.与目前很多离散方法不考虑决策相容性相比,该方法能够最大限度地保留系统的有用信息.通过实验验证了该方法的有效性.  相似文献   

7.
连续属性离散化是粗糙集理论的重要研究内容之一。将差别矩阵应用到连续属性离散化中,充分利用差别矩阵的优点,提出一种基于差别矩阵的粗糙集连续属性离散化算法。为使差别矩阵适应离散化应用中的需要,给出了粗糙集连续属性离散化中差别矩阵的定义。基于该差别矩阵,以候选断点在差别矩阵中的出现频率和断点重要性为启发式信息,对差别矩阵进行化简,直到该差别矩阵为空,即得到所求结果断点,以实现对决策表的离散化,并通过实例证明了该算法的高效性。  相似文献   

8.
由于电力大数据背景下电网设备监测数据具有体量大、种类多、产生速度快、精度高等特点,传统的连续属性离散化方法已经无法满足高效处理的要求。为了对电网设备监测大数据进行有效的数据预处理,本研究利用Map Reduce框架对基于似然比假设检验的连续属性离散化方法进行了并行化改进。最后,在Hadoop平台上对变电设备监测数据进行属性离散化,实验结果证明改进后的离散化方法可靠有效,适合当前电力大数据背景下的数据预处理。  相似文献   

9.
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力.  相似文献   

10.
食品安全是社会各界日益关注的民生问题,政府部门正在逐步完善监管体制、加大监管力度,构建社会共治的格局.本文针对已经曝光的食品安全事件,经过清洗筛选建立统一规范的数据存储,利用改进的基于信息熵模糊聚类分析算法对其进行数据挖掘,以便发现这些事件中具有象征性的现象以及典型性的安全事件,从而为政府制定管理决策和为民众提高防范意...  相似文献   

11.
空间数据挖掘技术是从空间数据库中提取隐含的、用户感兴趣的知识.针对当前的聚类算法没有很好考虑到空间数据的复杂性和数据之间的联系,再加上聚类的精确度不高,设计了一种新的算法—基于信息熵的空间聚类算法(ESCA算法),该算法优先考虑空间数据的复杂性和数据之间的联系,并采用蚁群优化机制改善传统算法中聚类簇数不确定的缺点.实验结果表明该算法是可行,并且具有更高的精确度.  相似文献   

12.
针对联合概率数据关联算法计算量上存在的组合爆炸问题,本文引入最大熵模糊聚类算法实现多目标的数据关联。使用最大熵模糊聚类得到的模糊隶属度表示目标与量测之间的联合互联概率;分析了公共回波对航迹更新的影响,对公共回波的权值进行衰减,对非公共回波的权值进行扩大,避免了航迹合并;此外根据差异因子的特性,给出剔除无效回波的方法,减少了计算量。仿真结果表明,与现有数据关联算法相比,新算法具有更优的跟踪效果。  相似文献   

13.
A Knowledge Reduction Algorithm Based on Conditional Entropy   总被引:1,自引:1,他引:0  
1 IntroductionSomeindustries ,includingtelecommunicationsandcreditcards ,haveinteractiverelationshipwithcustomersthatgeneratemanytransactionrecords,whichmakesdatatobegeneratedandcollectedatanunprecedentedspeed .However,thesedatahavetobeturnedintoknowledg…  相似文献   

14.
基于信息熵的一种传感器管理算法   总被引:16,自引:3,他引:16       下载免费PDF全文
通过对目标搜索区域不确定性定量描述的信息熵及信息熵变化而产生的信息增量,本文提出了一种多传感器对多目标进行检测与分类的优化算法,即针对每一检测单元计算该时刻的信息熵及预测下一时刻的信息熵,产生信息增量最大的检测单元就是下一次要搜索的单元.仿真结果证明了该算法的有效性.  相似文献   

15.
基于信息熵差异性度量的数据流增量集成分类算法   总被引:2,自引:0,他引:2  
琚春华  邹江波 《电信科学》2015,31(2):92-102
对分类器之间的差异性进行了研究,提出了一种基于信息熵差异性度量的增量集成分类算法,将信息熵差异性度量方法融入到基分类器选择过程中,通过对训练数据集的基分类结果的信息熵差异度计算,采用循环迭代优化的选择方法,以熵差异性最优化为约束目标,动态调整基分类器个数,实现了分类准确稳定,减少了系统开销。通过实验比对,证明了算法在数据流处理时比其他算法具有更小的开销和较强的适应性。  相似文献   

16.
提出了一种基于图像DCT域信息熵的盲检测算法。该算法通过分析JPEG图像隐写前后子块DCT系数信息熵的变化,提取JPEG图像子块DCT系数信息熵的64维特征向量,之后用LSSVM分类器对待测图像进行分类,最终达到检测载密图像的目的。实验表明,该算法能有效地针对各种隐写算法下的载密图像进行检测,同时对低嵌入比例下的载密图像也能达到较高的检测率。  相似文献   

17.
基于信息熵和TOPSIS法的目标威胁评估及排序   总被引:1,自引:1,他引:1  
针对现有空战目标威胁评估方法中存在的不足,提出了一种基于信息熵和TOPSIS法的空战目标威胁评估方法。首先建立了空战目标威胁评估指标,确定了角度、速度、隐身等威胁因子;为综合考虑评估中的主客观因素,采用了组合权衡因子确定最终权重;最后采用TOPSIS法作为威胁评估的解算方法,进行仿真验证,结果证明了该方法的有效性及合理性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号