期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王玲孟建瑶徐培培彭开香《工程科学学报》2017,39(7):1114-1122

由于时间序列数据具有高维度、动态性等特点,这就导致传统的数据挖掘技术很难有效的对其进行处理,为此,提出了一种基于多维时间序列形态特征的相似性动态聚类算法(similarity dynamical clustering algorithm based on multidimensionalshape features for time series,SDCTS).首先,提取多维时间序列的特征点以实现降维,然后,根据多维时间序列的斜率、长度和幅值变化的形态特征定义了一种新的时间序列相似性度量标准,进而提出无需人为给定聚类个数的多维时间序列动态聚类算法.实验结果表明,与其他算法相比,此算法对时间序列具有良好的聚类效果. 相似文献

2.

一种实时有效的蜂群模式挖掘算法

下载免费PDF全文

齐悦于彦伟邝俊何杰王沁《工程科学学报》2012,34(1):37-42

针对实时相关运动模式挖掘应用的需求,提出了一种实时地发现关闭蜂群模式的簇重组算法(CLUR).该算法维护一个候选蜂群模式列表,在每个时间戳采用基于密度的聚类算法对移动目标进行聚类,根据聚类结果组合所有的最大移动目标集,记录相应的时间集,然后构建候选蜂群模式,并更新到候选列表.算法给出了三种更新规则和一种插入规则,用于实现候选蜂群模式列表的更新,同时降低了候选列表的冗余度,提高了算法的效率.在每个时间戳结束时可通过关闭检测规则实时地发现当前时刻的关闭蜂群模式.在合成数据上的综合实验验证了CLUR算法的正确性、实时性和高效性,CLUR算法适用于实时相关运动模式挖掘系统. 相似文献

3.

分类属性数据聚类算法HABOS

下载免费PDF全文

武森姜丹丹王蔷《工程科学学报》2016,38(7):1017-1024

CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩.该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导.针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法(heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标(clustering validation index based on sparse feature dissimilarity,CVISFD)进行启发式度量,从而实现对聚类层次的自动选取.UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性. 相似文献

4.

分类属性高维数据基于集合差异度的聚类算法

武森魏桂英白尘张桂琼《工程科学学报》2010,32(8):1085-1089

提出基于集合差异度的聚类算法.算法通过定义的集合差异度和集合精简表示,直接进行一个集合内所有对象总体差异程度的计算,而不必计算两两对象间的距离,并且在不影响计算精确度的情况下对分类属性高维数据进行高度压缩,只需一次数据扫描即得到聚类结果.算法计算时间复杂度接近线性.实例表明该算法是有效的. 相似文献

5.

一种基于密度的模糊自适应聚类算法

下载免费PDF全文

王玲吴璐璐付冬梅《工程科学学报》2014,36(11):1560-1565

针对密度聚类算法对邻域参数设置敏感的问题,提出一种基于密度的模糊自适应聚类算法.算法在无需预先设置聚类数以及邻域参数的情况下,可以自适应地根据样本间距离关系确定邻域半径得到样本密度,并根据样本密度逐渐增加聚类中心.为了保障聚类结果的正确性,同时提出一种新的模糊聚类有效性指标以判断最佳聚类数,消除了密度聚类算法对参数的敏感性.用UCI基准数据集进行实验,发现本文算法在对数据进行聚类时,聚类质量较原始密度聚类算法在准确性和自适应性方面均有显著提高. 相似文献

6.

基于非结构化数据挖掘结构模型的Web文本聚类算法

胡健杨炳儒宋泽锋钱榕《工程科学学报》2008,30(2):217-220

在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识. 相似文献

7.

一种面向网络长文本的话题检测方法

下载免费PDF全文

郑恒毅廖城霖李天柱《工程科学学报》2019,41(9):1208-1214

提出了一种面向网络长文本的话题检测方法.针对文本表示的高维稀疏性和忽略潜在语义的问题,提出了Word2vec&LDA（latent dirichlet allocation）的文本表示方法.将LDA提取的文本特征词隐含主题和Word2vec映射的特征词向量进行加权融合既能够进行降维的作用又可以较为完整的表示出文本信息.针对传统话题发现方法对长文本输入顺序敏感问题,提出了基于文本聚类的Single-Pass&HAC（hierarchical agglomerative clustering）的话题发现方法,在引入时间窗口和凝聚式层次聚类的基础上对于文本的输入顺序具有了更强的鲁棒性,同时提高了聚类的精度和效率.为了评估所提出方法的有效性,本文从某大学社交平台收集了来自真实世界的多源数据集,并基于此进行了大量的实验.实验结果证明,本文提出的方法相对于现有的方法,如VSM（state vector space model）、Single-Pass等拥有更好的效果,话题检测的精度提高了10%~20%. 相似文献

8.

基于不同算法的高炉操作炉型聚类效果对比

下载免费PDF全文

鲁杰闫炳基赵伟李鹏陈栋国宏伟《工程科学学报》2022,44(12):2081-2089

高炉操作炉型与高炉操作、技术经济指标等关系密切,合理的操作炉型有利于保证高炉生产的优质、低耗、高产、长寿.通过对冷却壁温度的聚类分析,能够有效合理地表征高炉操作炉型的变化,对高炉生产有着重要的指导意义.分别采用K-Means、TwoStep对数据集进行聚类分析,基于两种聚类算法的原理,结合Davies-Bouldin index(DBI)与Dunn index(DI)对聚类结果进行评价,分析不同聚类算法间的差异,得出了在所选样本数据及数据特征基础上,K-Means算法聚类结果更好的结论,该研究可为高炉炼铁大数据分析中的聚类算法选择提供有力参考. 相似文献

9.

基于谱聚类算法的岩体结构面产状优势分组

何顺斌刘杰《黄金科学技术》2017,25(4):46-51

结构面分组是开展岩体工程稳定性分析的基础,为此,采用谱聚类算法根据岩体结构面产状信息将结构面进行优势组划分。与目前广泛使用的K均值聚类相比,该算法能够收敛到全局最优。选取结构面法向量所夹锐角的正弦值平方作为结构面间的相似度量准则,应用谱聚类算法进行优化求解;同时,引入Silhouette指标对聚类有效性进行评价,以确定最佳分类数目。利用谱聚类方法对人工生成结构面数据进行计算的结果验证了该方法的可靠性。最后,将该算法应用于三山岛金矿岩体结构面的优势组划分,取得了理想的分类效果,为进一步岩体稳定性分析提供了可靠的数据基础。相似文献

10.

基于图像片的模糊C均值聚类图像分割

顾建伟《Canadian Metallurgical Quarterly》2011,(5)

本文提出了一种全新的基于图像片的模糊C均值聚类的图像分割方法.将图像片的思想引入聚类分割中,提出IPFCM方法,用局部的图像片来代替聚类分割中的像素点,从而增大不同类别之间的差异,并对隶属度更新函数进行改造使隶属度函数分布具有单峰值性.实验结果表明,本文方法具有较强的抗噪性和较高的分割精度,图像的隶属度函数与理想隶属度函数十分接近.同时无需过多控制参数,具有较强的可靠性和适应性.另一方面,本文将聚类中心的每一个成员扩展为一个向量,并给出了向量聚类中心的更新公式,为日后将多种图像特征加入FCM对图像进行分割提供了充分的理论基础. 相似文献