首页 | 本学科首页   官方微博 | 高级检索  
     

.连续属性离散化算法比较研究*
引用本文:刘业政,焦宁,姜元春..连续属性离散化算法比较研究*[J].计算机应用研究,2007,24(9):28-30.
作者姓名:刘业政  焦宁  姜元春
作者单位:合肥工业大学,管理学院,电子商务研究所,合肥,230009
基金项目:国家自然科学基金 , 高等学校博士学科点专项科研项目
摘    要:探讨了贪心及其改进算法、基于属性重要性、基于信息熵和基于聚类四类连续属性离散化算法,并通过实验验证这四类算法的离散化效果.实验结果表明,数据集离散化的效果不仅取决于使用算法,而且与数据集连续属性的分布和决策数据值的分类也有密切关系.

关 键 词:离散化  贪心算法  属性重要性  信息熵  聚类  连续属性  属性离散化算法  算法比较  研究  continuous  attributes  algorithms  discretization  comparison  关系  分类  数据集  决策  分布  使用  结果  实验验证  效果  聚类  信息熵  属性重要性
文章编号:1001-3695(2007)09-0028-03
修稿时间:2006-07-112006-09-30

Study on comparison of discretization algorithms of continuous attributes
LIU Ye zheng,JIAO Ning,JIANG Yuan chun.Study on comparison of discretization algorithms of continuous attributes[J].Application Research of Computers,2007,24(9):28-30.
Authors:LIU Ye zheng  JIAO Ning  JIANG Yuan chun
Affiliation:(Institute of Electronic Business, School of Management, Hefei University of Technology, Hefei 230009, China)
Abstract:This paper disscussed four kinds of discretization methods which include greedy and some improved algorithms, significance of attributes, entropy of information and clustering-based algorithms. And compard the quality of the four categories of algorithms. The last experiments indicate that the quality of discretization of dataset not only lies on the algorithm, but also is closely related to distributing of continuous attributes and data of decision.
Keywords:discretization  greedy algorithm  significance of attributes  entropy of information  clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号