首页 | 本学科首页   官方微博 | 高级检索  
     

一种测试数据挖掘算法的数据源生成方法
引用本文:杜鹢,李德毅.一种测试数据挖掘算法的数据源生成方法[J].计算机研究与发展,2000,37(7):776-782.
作者姓名:杜鹢  李德毅
作者单位:1. 中国人民解放军理工大学,南京,210016
2. 中国电子系统工程研究所,北京,100036
基金项目:国家“八六三”高技术研究发展计划基金项目资助!(项目编号 3 0 6-ZT0 6-0 7-2)
摘    要:随着数字时代的来监,数据挖掘成为知识领域中的研究热点,但由于保密、数据多样性等问题,测试数据源的获得取一直困扰着数据挖掘算法的研究,为此,提出一种基于云模型的测试数据源生成方法,利用此方法,给出了数量型数据的生成算法,对范畴型数据的生成进行了讨论,由于云模型中随机性与模糊性和特点,各属性的数据之间除了包含已知的先验知识以外,数据的分布、各属性之间的关系也会存在一定的随机和模糊,使得构造的数据源中又

关 键 词:数据挖掘  云模型  数据源生式  数据库  算法  测试

A METHOD OF DATA SOURCE GENERATION FOR TESTING DATA MINING ALGORITHMS
DU Yi,LI De-Yi.A METHOD OF DATA SOURCE GENERATION FOR TESTING DATA MINING ALGORITHMS[J].Journal of Computer Research and Development,2000,37(7):776-782.
Authors:DU Yi  LI De-Yi
Abstract:Because of the problem of secrecy, diversity of data and so on, data resources for testing data mining algorithms always persecute the research of data mining. Therefore, a method of data source generation based on a cloud model is presented in this paper. The generation algorithm for quantitative data is given and the generation of categorical data is also discussed. Because of the randomness and fuzziness in the cloud model, the generated data contain potential knowledge except known knowledge, and the data distribution and relationship between attributes also have random and fuzzy facts. Researchers can use this model to generate diverse type and diverse quantitative data they want and then test the data mining algorithms.
Keywords:data mining  cloud model  cloud generator
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号