首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
目的:探讨基因海量时间序列信号的归类方法.方法:将小波多尺度分析引入,在多个尺度上进行聚类,并结合FCM得到新的聚类算法.结果:应用新的聚类方法,对小脑组织的一组基因芯片时间序列信号进行分析,通过分类结果对照发现,各类中的大多数基因生物学意义接近.结论:此改进的聚类方法是有效的,是一种新的思路.  相似文献   

2.
基于小波分解和聚类模糊系统的时间序列预测   总被引:1,自引:0,他引:1  
黄景春  肖建 《计算机应用》2006,26(10):2395-2397
结合小波分析的多分辨特性和模糊规则的可解释性,提出了一种非平稳时间序列预测方法。首先将时间序列信号分解为各尺度上的细节信号和平滑信号,使用软、硬阈值折衷法消除噪声,并对各层重构信号单独使用聚类模糊系统进行预测,最后将各预测结果累加得到对整个时间序列的预测。仿真试验表明此方法是有效的。  相似文献   

3.
针对时间序列子序列聚类存在的平凡相似和水平伸缩等问题,提出了一种新的子序列聚类算法。它采用多孔平滑滤波器组对时间序列进行低通平滑处理,在所得到的多个尺度序列上生成平凡簇,然后将各个平凡簇的代表子序列作为数据样本进行聚类。新方法利用平凡簇克服了子序列聚类中的平凡相似问题,并且可以在时间序列上发现不等长的相似子序列,较好地解决了水平轴伸缩问题。实验结果证明新算法对于子序列聚类具有比较好的效果。  相似文献   

4.
对雷达信号的载频模式进行识别的传统方法一般都是基于统计法的,但是往往识别效果并不理想。聚类分析方法是一种经典的模式识别方法,它原理简单,计算方便,可为雷达载频模式识别提供一种新的分析思路。通过对雷达信号的载频序列进行聚类分析,并根据聚类结果来对雷达信号载频模式进行识别,仿真实验验证了算法的有效性。最后在此基础上,使用动态聚类分析方法替换原来的聚类分析法,取得了更好的识别效果。  相似文献   

5.
针对存在异常值的时间序列数据,提出了一种基于相关系数鲁棒估计的时间序列间的鲁棒广义互相关度量(RGCC)。首先,引入一种鲁棒相关系数代替Pearson相关系数来计算时间序列数据间的协方差矩阵;其次,用新的协方差矩阵的行列式构造两个时间序列间的相似性度量——RGCC;最后,基于该度量计算出序列间的距离矩阵,将其作为聚类算法的输入对数据进行聚类。时间序列聚类仿真实验表明,对存在异常值点的时间序列数据,与基于原始的广义互相关度量(GCC)得到的聚类结果相比,基于RGCC得到的聚类结果明显更接近真实的聚类结果。可见,所提出的新的鲁棒相似性度量完全适用于存在异常值的时间序列数据。  相似文献   

6.
一种新的基于隐Markov模型的分层时间序列聚类算法   总被引:4,自引:0,他引:4  
针对传统的基于隐Markov模型(HMM)的聚类算法在时间序列聚类的不足,提出了一种新的基于HMM的分层时间序列聚类算法HBHCTS,旨在提高聚类质量,同时对聚类结果给出类的表示、HBHCTS算法应用HMM对时间序列进行建模,并按照“最相似”的原则得到序列所对应的初始模型集,进而对这些初始模型合并更新及迭代得到聚类结果.实验中主要研究了聚类正确率与序列长度及模型距离的关系,结果表明HBHCTS算法比传统的基于HMM的聚类算法准确性高.  相似文献   

7.
一种基于Markov链模型的动态聚类方法   总被引:11,自引:0,他引:11  
对单变量时间序列的聚类,是一类有着广泛应用背景的特殊的聚类问题。由于该问题的特殊性,现有的聚类方法无法直接使用,故提出了一种新的基于Markov链模型的动态聚类方法。该方法首先对每一个时间序列建立一个描述其动态特征的Markov链模型,从而把对时间序列的聚类问题转化为对Markov链模型的聚类问题。然后通过定义各个Markov链之间的“距离”,采用动态聚类算法完成对这些Markov链模型的聚类,使用该方法,分别对一经真实数据和仿真数据进行了聚类试验,都获得了比较好的聚类结果。  相似文献   

8.
针对时间序列的全序列聚类展开,提出一种新的相似性度量——全局特征,即从时间序列的统计分布特征、非线性和Fourier频谱转换等3个方面提取11个全局特征构建特征向量。利用特征向量来描述原时间序列,不仅保留了大部分原有的信息,还能加快聚类计算的速度。经过大量的实验验证表明,基于全局特征提取的相似性度量能得到合理的聚类结果,特别是对经济领域的时间序列效果更为明显。例举了2个数据进行实验,并从主观和客观两个角度对聚类结果进行评估。  相似文献   

9.
多尺度聚类挖掘在指导人们进行多尺度决策方面有着不可取代的作用,然而传统的多尺度聚类挖掘算法有一个致命的弱点,即需要在每个用户感兴趣的尺度上应用聚类挖掘算法.为克服此缺陷,定义了一种将数据的多尺度特性进行向量化的方法;结合地学领域的尺度转换机制,提出了一种新的知识的多尺度转换机制——基于加权向量提升的多尺度聚类挖掘算法WVB-MSCA(Weight Vector Based Multi-scale Clustering Algorithm).算法首先在选定的基准尺度上进行聚类挖掘,获取聚类结果,并借助尺度转换机制将基准尺度的聚类结果反演到其它感兴趣的尺度上.实验表明,算法WVB-MSCA是可行且有效的.  相似文献   

10.
符号化表示技术,可以有效降低时间序列的维度,是实现海量时间序列数据挖掘的基础.聚类结果的精度是运用聚类方法对多元时间序列进行符号化表示的关键.运用共同马氏距离虽然可以实现多元时间序列的符号化表示,但忽略了不同类样本数量对聚类结果的影响,从而降低了符号化表示的有效性.针对上述问题,提出一种改进共同马氏距离的多元时间序列符号化表示方法,通过改进共同协方差矩阵的计算方法,优化了聚类结果,从而提高了符号化表示的有效性.仿真结果表明,改进后的方法可以更加有效地对多元时间序列进行符号化表示.  相似文献   

11.
对于时间序列的基因表达数据,传统的聚类算法都是以距离为相似性度量标准,没有考虑基因随时间变化的相似趋势。从基因变化的趋势出发,构造了一种新的模糊相似关系矩阵,提出了改进的基于模糊相似关系的聚类算法,并以该算法计算FCM的初始聚类中心。将该方法应用在酵母菌基因表达数据中,实验结果表明该算法不仅克服了FCM算法易陷入局部极小值、对初值敏感的缺点,而且能够发现一些表达模式变化趋势相似的共调控基因。  相似文献   

12.
模糊c均值算法是一种局部搜索迭代法,易陷入局部最小解,而且算法未考虑样本对聚类的贡献程度。针对传统的模糊c均值(FCM)算法的不足和基因表达数据高噪声的特点,提出了一种基于小波变换和改进的FCM聚类模型,最后将该模型应用于白血病基因数据分析。根据Xie-Beni指数,在没有先验知识的条件下,确定了最佳聚类个数。为了体现文中提到的算法对样本聚类的准确性,本文分别采用传统的FCM聚类算法和分层聚类的方法在同样的试验条件下进行试验。样本聚类的结果表明:该方法能得到高准确度的样本分型结果。  相似文献   

13.
基于遗传算法及聚类的基因表达数据特征选择   总被引:1,自引:0,他引:1  
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因。针对此问题,本文提出了一种新的面向基因表达数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用聚类算法及聚类错误率作为学习算法及评价指标。实验结果表明,该算法可有效地找出具有较好可分离性的特征子集,从而实现降维并提高聚类及分类精度。  相似文献   

14.
传统的基因表达式编程在解决多分类问题时,人为地把多分类转换成多次两分类。融合了K-最邻近分类和基因表达式编程两种技术,做了下列工作:(1)提出了基于基因表达式编程中的特征抽取,证明了特征抽取区多样性定理;(2)提出了特征的自动聚类策略和特征集的自动选择策略,用特征的聚类辅助对象的分类;(3)提出基于基因表达式编程的最邻近距离分类算法,用抽取出的特征采用最邻近距离分类算法进行多分类;(4)实验表明,采用基于基因表达式编程的最邻近距离分类算法,有效地解决了多分类问题,改善了分类性能,使平均分类正确率提高约4%~10%,用于分类的特征维数减少60%~79%。  相似文献   

15.
When gene expression datasets contain some labeled data samples, the labeled information should be incorporated into clustering algorithm such that more reasonable clustering results can be achieved. In this paper, a novel semi-supervised clustering algorithm, Semi-supervised Iterative Visual Clustering Algorithm (Semi-IVCA), is presented to tackle with such datasets. The new algorithm first constructs the visual sampling image of the dataset based on visual theorem and obtains its attractors using the gradient learning rules, where each attractor denotes a cluster of the dataset. Then the new algorithm introduces an iterative clustering procedure to realize the semi-supervised learning. The new algorithm is a generalization of the current Visual Clustering Algorithm (VCA) presented by authors. Except for the advantage that Semi-IVCA can effectively utilize the labeled data information in clustering, it is robust and insensitive to initialization, and it has strong parameter learning capability and good interpretation for the clustering results. When the new algorithm Semi-IVCA is applied to the artificial and real gene expression datasets, the experimental results confirm the above advantages of algorithm Semi-IVCA.  相似文献   

16.
针对基于粒子群优化的聚类算法容易陷入局部最优值的缺点,提出将量子行为粒子群优化应用于基因表达数据的聚类分析问题中。在新的聚类算法中采用了对粒子群的多样性控制,以提高算法的全局收敛性能;此外还在新算法中引入了类似于K均值聚类的操作步骤,用以提高算法整体的收敛速度。选择Rand指数和Silhouette指数作为聚类评价标准,对5个人工和实际的基因表达数据集合进行聚类实验分析表明,新算法和基于粒子群优化的聚类算法相比,具有较快的收敛速度,粒子多样性的控制能有效改善算法的全局收敛性能。和其他一些常用的聚类算法比较,也能够获得更好的聚类评价,聚类效果更好。  相似文献   

17.
一种新聚类算法在基因表达数据分析中的应用   总被引:2,自引:1,他引:1       下载免费PDF全文
自组织特征映射神经网络与层次聚类算法是两种较经典的分析基因表达数据的聚类算法,但由于基因表达数据的复杂性与不稳定性,这两种算法都存在着自身的优劣。因此,在比较两种算法差异性的基础上,创造性地提出了一种新算法,即通过SOM算法对基因表达数据进行聚类,再用层次聚类将每个类对应的神经元权值二次聚类,并将此算法应用在酵母菌基因表达数据中,用实验证明改进算法克服了自组织算法的一些缺陷,提高了基因聚类的效能。  相似文献   

18.
庞淑敬  彭建 《微计算机信息》2012,(1):161-162,172
针对数据集中若存在孤立点或者是噪声数据会影响模糊C均值聚类算法(FCM)的聚类性能问题,本文将离群点的辨认方法与FCM算法相结合,提出一种改进的FCM聚类算法。该算法有效地降低了孤立点或噪声数据对正常数据的影响,提高了FCM算法的聚类精度。将该算法在入侵检测系统中进行实验验证,通过与FCM算法进行对比分析,证明了该算法的有效性和可行性。  相似文献   

19.
基于有效性测度的基因表达数据的模糊聚类分析   总被引:1,自引:0,他引:1  
本文讨论了模糊聚类中的模糊C均值算法和聚类有效性测度。结合基因微阵列的特点,设计并实现了一种基于聚类有效性函数的模糊C均值模型。将该种模型运用于公开的白血病基因表达数据,取得了与实际情况相吻合的实验结果。  相似文献   

20.
针对化工生产过程的安全性问题,提出基于混合蛙跳(shuffled frog leaping algorithm,SFLA)的FCM聚类算法。该算法引入寻优能力强的SFLA求得最优解作为FCM算法的初始聚类中心,然后利用FCM算法优化初始聚类中心,最后求得全局最优解,从而有效避免了F C M算法易陷入局部最优和对初始值敏感的缺点。将该算法用于化工生产状态数据的聚类分析,实验结果表明,本文算法与F C M聚类算法相比,提高了算法的寻优能力,聚类效果更好;并且能够快速、客观地对化工生产过程的状态进行判别,为其安全运行提供了保障。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号