基于密度峰值聚类的超区间粒化方法及其分类模型 |
| |
引用本文: | 吴成英,张清华,赵凡,程云龙,谢秦,夏书银,王国胤.基于密度峰值聚类的超区间粒化方法及其分类模型[J].计算机学报,2023(8):1620-1635. |
| |
作者姓名: | 吴成英 张清华 赵凡 程云龙 谢秦 夏书银 王国胤 |
| |
作者单位: | 1. 重庆邮电大学计算智能重庆市重点实验室;2. 旅游多源数据感知与决策技术文化和旅游部重点实验室;3. 湖北民族大学;4. 重庆邮电大学大数据智能计算重点实验室 |
| |
基金项目: | 国家自然科学基金(62276038,62221005);;国家重点研究发展计划(2020YFC-2003502);;重庆市自然科学基金(cstc2019jcyj-cxttX0002); |
| |
摘 要: | 大数据挖掘时代,数据丰富与知识贫乏之间的矛盾日趋突出.粒计算是解决大规模、复杂问题的新范式,其核心任务是粒化.粗糙集是经典粒计算模型之一,在数据挖掘领域已广泛应用.遗憾的是基于不可区分关系的粒化条件很严格,造成粗糙集在粒化定量数据时会失效.因此,本文首先从一维属性的区间划分出发,定义多维属性组合生成的超区间粒,并基于超区间粒提出新颖的粗糙集模型有效地将定量数据和定性数据统一到一个框架;其次,从决策属性的视角考虑条件属性之间的相关性提出基于密度峰值聚类的超区间粒化算法,算法输出的超区间粒不仅是论域的划分,且每个划分块都是同质信息粒;最后,受近邻分类算法的启发,融合多数投票分类机制和近邻分类准则基于超区间粒提出自适应近邻分类模型(IGANN),并在UCI数据集上与8个经典分类模型进行实验对比,4个指标下的对比结果均表明IGANN模型具有更强的稳定性和更高的鲁棒性.
|
关 键 词: | 粒计算 粗糙集 粒化 信息粒 密度峰值聚类 |
|
|