排序方式: 共有128条查询结果,搜索用时 465 毫秒
91.
基于向量内积不等式的分布式k均值聚类算法 总被引:13,自引:2,他引:11
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这一问题的有效方法.在已有分布式聚类算法k—DMeans基础上,结合向量内积不等式关系对算法加以优化,提出分布式聚类算法k—DCBIP.理论分析和实验结果表明,算法k—DCBIP优于k-DMeans,可以有效地解决大数据集聚类问题,算法是有效可行的. 相似文献
92.
k-LDCHD--高维空间k邻域局部密度聚类算法 总被引:7,自引:0,他引:7
聚类是数据挖掘领域的一项重要课题,高维空间聚类以数据分布稀疏、噪声数据多、“差距趋零现象”而成为难点.在分析现有聚类算法不足的基础上,引入k邻域点集、k邻域半径等概念,提出一种高维空间单参数k邻域局部密度聚类算法k—PCLDHD;为了提高算法的效率,进一步定义了参考距离等概念,并采用“双参考数据点”对数据集中的数据对象进行预处理,以减少扫描数据集的开销。提出k—PCLDHD的优化算法k—LDCHD.理论分析和实验结果表明,算法可以有效解决高维空间聚类问题,算法是有效可行的. 相似文献
93.
基于最优K相异性的密度聚类算法研究 总被引:1,自引:0,他引:1
该文提出一种利用最优K相异性算法(OptiSim)的密度聚类算法,通过代表性子集选择技术与DBSCAN算法的结合,可显著降低I/O耗费和内存需求,使之能够有效地处理大规模空间数据库,并提出一种扩展的OptiSim代表性子集选择方法(EOptiSim),它在处理组合数据库方面能弥补基本的OptiSim方法的不足。实验结果表明文章的算法是可行、有效的。 相似文献
94.
95.
针对商业销售的智能分析需求,文章提出了一种基于模糊集合的数据挖掘时间序列模式算法。该算法已得到有效的应用,对企业的经营决策有一定的参考价值。 相似文献
96.
本文在分析联邦数据库系统成员异构的特点后,论述了一种基于输入/输出模式和概念模式的转换方法,通过该转换处理可以有效地解决模式异构的问题,这种方法已在SU-FDBS原型中实现。 相似文献
97.
98.
99.
100.
介绍了人机交互的遗传算法的基本原理 ,论述了用人机交互的遗传算法挖掘股票投资风险规则的算法思想和关键问题 ,包括规则的表示与编码、适应度函数的定义以及交叉、变异和选择操作 ,提出了基于人机交互遗传算法的股票投资风险规则挖掘算法 .应用该算法从股票交易数据库中挖掘一段时间内股票涨跌与其属性之间的关系 .实验结果表明该算法是可行的和有效的 .人机交互的遗传算法对于挖掘股票投资风险规则以及求解人机合作的“可操作性”问题 ,提供了一种方法和途径 相似文献