关联性大数据实时流式可控聚类算法 |
| |
作者姓名: | 傅正英 康惠 |
| |
作者单位: | 1. 成都工业职业技术学院马克思主义学院;2. 成都工业职业技术学院信息工程学院(新华三芯云产业学院) |
| |
摘 要: | 针对当前关联性数据在聚类后聚类结果与对应聚类簇之间距离过大,聚类簇本身聚类纯度较低等影响聚类质量的问题,开展相关研究。通过构建关联性大数据实时流式可控聚类框架、可控粗聚类、可控细聚类,提出一种全新的聚类算法。实验结果表明,新的聚类算法聚类结果与对应聚类簇的距离平方和数值更小,聚类簇本身聚类纯度更高,进一步提升聚类结果的质量,实现对关联性大数据的高效利用。
|
关 键 词: | 关联性大数据 可控聚类算法 K-means算法 |
|
|