共查询到18条相似文献,搜索用时 78 毫秒
1.
当前面向时间序列有序分类的Shapelet抽取算法,首先计算Shapelet与时间序列之间的欧式距离及其类别标签之间的距离,然后根据两种距离的皮尔逊相关系数或斯皮尔曼相关系数来对Shapelet进行评价,效率较低。针对该问题,提出一种基于SAX表示时间序列的Shapelet评价指标CD-Cover,该指标同时考虑Shapelet对时间序列数据集的覆盖集中度和覆盖优势度。其次,提出一种基于随机采样的Shapelet抽取算法,该算法采用布隆过滤器对候选Shapelet进行预剪枝,采用移除自相似策略对抽取结果进行后剪枝。在11个时间序列公开数据集上的实验结果表明,相比现有方法,该算法抽取的Shapelet具有更好的有序分类能力,且算法的计算效率也更高。 相似文献
2.
《西安邮电学院学报》2018,(3):52-58
为了提高噪声污染图像分割的鲁棒性,提出一种基于稀疏自表示的模糊C均值聚类图像分割算法。该算法首先将图像过分割为超像素,以超像素作为图像基元,对每一块超像素进行特征提取,所有超像素的特征组成图像的特征矩阵;其次建立特征矩阵的稀疏自表示模型,将其以自身为字典时的表示系数作为表示样本间相关性的判别特征矩阵;最后利用模糊C均值聚类算法聚类图像的判别特征矩阵,得到图像的分割结果。对人造图像、自然图像和遥感图像添加高斯噪声和椒盐噪声,实验结果表明,改进算法对噪声污染的图像有较好的分割质量,有一定的抗噪鲁棒性。 相似文献
3.
ILS中知识的聚类和表示 总被引:1,自引:0,他引:1
在网络教育中,传统的导航方式或搜索引擎方式引导学习过程有着自身固有的缺陷,无法实现智能化、个性化学习,采用一种反映知识模块间关系的知识混合结构方式,通过对知识的规范录入和基于关联规则的知识聚类,得到一系列相关的知识项,以知识项和知识交流域(上下文)的映射来引导学习过程,能智能地向学习者提供建议性的相关学习内容及上下文,是一种有效的智能学习解决方案。 相似文献
4.
针对深度多视子空间聚类网络在进行数据融合时不能区分各视图可靠性, 以及缺乏对多视数据间一致性信息与互补性信息的利用等问题, 提出一种基于自适应的权重融合深度多视子空间聚类(deep multi-view subspace clustering based on adaptive weight fusion, DMSC-AWF)方法。首先, 通过使各视图共享同一个自表示层学习一个公共的表示矩阵, 同时为各视图分别构建自表示层来学习各视图特定的表示矩阵, 以此确保多视数据的一致性信息和互补性信息得以有效利用。然后, 在共享自表示层基础上引入注意力模块来量化不同视图的重要性, 注意力模块自适应地为每个视图数据分配权重。最后, 在4个公开数据集上进行聚类实验, 该方法的聚类结果相比于对比方法有明显的提升, 并且, 通过退化实验验证了注意力模块学习视权重的有效性和重要性。
相似文献5.
用于不同密度聚类的多阶段等密度线算法 总被引:9,自引:1,他引:9
多阶段等密度线算法是在基于网格的等密度线聚类算法的基础之上 ,采用多阶段的聚类方式来解决分布密度变化较大的数据集的聚类分析问题. 该算法能够找出分布密度不同的各种类别 ,并能很快地处理高维数据集. 此外 ,还能有效地对时间序列数据集进行聚类. 相似文献
6.
多视图子空间聚类是处理高维数据的一种聚类方法,通过分别在每个视图上构造邻接矩阵的方法解决聚类问题,但未考虑到低秩表示和稀疏约束的结合在构造邻接矩阵中的重要性. 针对此问题,提出一种联合低秩表示和稀疏约束的双层多视角子空间聚类方法,使其更全面地描述数据本身,从而实现更有效的聚类,并采用ADMM方法来解决每个视图相关的低秩表示和稀疏性约束优化问题. 在多个数据集上的实验表明,其聚类性能比现有的多视角子空间聚类算法好,低秩表示和稀疏约束的结合可以提高聚类的准确性. 相似文献
7.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性. 相似文献
8.
一种新的基于蚁群和凝聚的混合聚类算法 总被引:2,自引:0,他引:2
在经典蚁群算法和经典聚合算法的基础上,该文在改进蚁群算法的同时提出了一种新的基于蚁群和凝聚的混合聚类算法。该算法首先在蚂蚁放置物体时采用紧凑算法,其次对于可被蚂蚁负载的物体采用基于评估函数的调度算法,最后将凝聚算法融入蚁群算法的迭代过程。实验通过与其它聚类算法比较表明,该算法在继承了蚁群算法固有优点的同时,提高了时间效率,获得了较好的结果。 相似文献
9.
针对现有的数据流聚类算法不能在线实时生成用户需要的聚类结果问题,提出一种基于滑动窗口的数据流在线聚类算法.该算法采用密度网格存储结构,实现了数据流的在线聚类过程,能实时地向用户提供聚类结果,动态地检测数据流的进化情况.实验结果表明,该方法具有快速在线聚类能力,并能保证良好的聚类质量. 相似文献
10.
基于聚类的股票波动分析及其应用 总被引:1,自引:0,他引:1
Markowitz提出的“期望均值收益-收益方差“规则(M-V),模型要求选择差异性较大的资产进行组合,从而在给定收益率水平下,降低组合的风险。在M-V模型的基础上,采用了数据挖掘中聚类的方法,定义出一种衡量时间序列样本之间相似性程度的指标,这个指标反应了股票间波动行情趋势的异同。在此基础上对资产价格序列性进行聚类分析,与单纯M-V模型相比,在给定的收益率水平下降低了资产组合的风险。采用上证指数中若干股票进行实验验证表明,在给定的收益率下,采用基于密度的层次聚类方法的股票组合可以得到比随机组合更小的风险水平。 相似文献
11.
针对LSHST(LocalitySensitive Hashing ShapeletTransform)局部敏感哈希的shapelet转换方法中随机筛选造成更具差异性特征的子序列漏选,从而影响shpelets最终筛选质量的问题,提出了基于Fast-DTW-LSH的shapelet筛选方法,通过局部敏感哈希函数将高维空间... 相似文献
12.
信道状态信息(CSI)受时空影响较大,导致现有基于CSI的室内定位技术鲁棒性差.针对这一问题,提出了基于Shapelet算法的指纹定位方法.在训练阶段将CSI作为原始位置数据,通过3-σ异常值处理法和卡尔曼滤波对原始数据进行处理、修正;再使用Shapelet算法提取每个位置的指纹,并建立指纹库;最后使用指纹库构建Shapelet决策树,通过决策树分类实现较为精准的定位.通过与主成分分析算法以及k近邻算法的对比实验,结果表明,该方法在不同时间的定位精度较高,且能保持性能稳定,所需训练集更小. 相似文献
13.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法. 相似文献
14.
时间序列包含的数据量大、维数高、数据更新快,很难直接在原始时间序列上进行数据挖掘.借鉴时间序列线性分段的基本思想,提出了一种基于关键点的分段线性表示法,用关键点组成的直线段近似描述时间序列.将关键点作为时间序列的分割点,反映时间序列的主要特征,降低时间序列的维数,使整体误差达到最小. 相似文献
15.
一种新的聚类算法:等密度线算法 总被引:7,自引:3,他引:7
提出了一种新的聚类算法:等密度线聚类算法。该算法从样本分布等密度线图的思想出发,从图中找出样本分布比较集中的区域,从而发现隐含在样本集中的类。等密度线聚类算法不需要输入任何参数,是一种无监督式聚类。它能够自动发现任意形状的类,并且能有效地排除噪声干扰。实验结果表明,等密度线聚类算法具有较快的聚类速度和较好的聚类效果。 相似文献
16.
基于主成分分析的密度聚类算法 总被引:1,自引:0,他引:1
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果. 相似文献
17.
分簇是一种能将节点分成逻辑上独立的组的机制,在MANET中应用分簇算法得到的分级式结构能提高网络的总体性能.介绍了分簇算法的构成和度量分簇算法性能优劣的标准,并对几类典型的分簇算法进行了分析和比较,最后指出了其中存在的问题. 相似文献
18.
分簇是一种能将节点分成逻辑上独立的组的机制,在MANET中应用分簇算法得到的分级式结构能提高网络的总体性能.介绍了分簇算法的构成和度量分簇算法性能优劣的标准,并对几类典型的分簇算法进行了分析和比较,最后指出了其中存在的问题. 相似文献