首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 218 毫秒
1.
基于数据挖掘的网络论坛话题热度趋势预报   总被引:1,自引:0,他引:1       下载免费PDF全文
利用小波分析和神经网络相结合的方法进行网络论坛话题热度趋势的预报。该方法主要是对由帖子的点击数(或回复数)所形成的原始时间序列进行小波多尺度分析,产生一系列子序列并进行评价,并通过BP神经网络进行类别训练,找出使得类内距离最小、类间距离最大的若干系数作为特征系数。对于未知类别的时间序列,把其特征系数送入神经网络进行预测。实验结果表明,将该方法用于网络论坛话题的热度趋势预测,可得出良好的预测精度。  相似文献   

2.
在资源受限条件下,根据数据挖掘任务在执行过程中实时产生的资源和任务状态来准确地预测任务执行时间是非常重要的。为有效地使用时间序列数据实现准确预测,提出一种降载策略来确定预测的切入点和数据处理方案。该策略使用动态时间规整(Dynamic Time Warping, DTW)距离度量子序列与整个序列之间相似度的变化以确定用于预测的数据,然后利用小波变换计算小波系数并提取小波系数的能量值作为预测的特征,最后预测任务执行时间。实验结果表明,该方法提取的特征信息包含原序列较多信息,在预测任务执行时间方面具有较高的准确性。  相似文献   

3.
针对K近邻(KNN)方法处理大数据集的效率问题进行了研究,提出了一种基于Spark框架的分布式精确模糊KNN分类算法, 创新性地将Spark框架分布式map和reduce过程与模糊KNN结合。首先对不同分区中训练样本类别信息进行模糊化处理,得到类别隶属度,将训练集转换为添加类隶属度的模糊训练集;然后使用KNN算法对先前计算的类成员测试集计算得到◢k◣个最近邻;最后通过距离权重进行分类。针对百万级大数据集样本的实验,以及与其他算法的对比实验表明,所提算法是可行的和有效的。  相似文献   

4.
王露珊  刘兵  刘勇 《计算机应用》2007,27(3):570-573
使用小波变换缩减维度是解决高维时间序列查询的一个有效方法。传统的算法均使用变换后小波序列的前k个系数作为原始时间序列的一个近似估计。但是由于选择前k个系数不一定能很好地近似原始序列集合。给出相关定理,说明选择小波系数集合的列平方和最大的k列,可以更好近似原始序列集合。实验结果表明,相对于传统算法,该方法可以更好地缩小相对误差。  相似文献   

5.
目前基于相似度的聚类方法对风电出力场景进行聚类划分,而相似度又大多采用欧式距离长短作为衡量依据,其结果反映时间序列曲线的幅度大小差异,未能反映出曲线的形态特征及变化趋势的不同.本文提出一种基于高斯混合聚类的风电出力场景划分的方法,即通过属于某一类的概率大小来判断最终的归属类别.首先根据BIC准则,肘部法则和轮廓系数分别...  相似文献   

6.
一种网络流量预测的小波神经网络模型   总被引:12,自引:1,他引:11  
雷霆  余镇危 《计算机应用》2006,26(3):526-0528
结合小波变换和人工神经网络的优势,建立一种网络流量预测的小波神经网络模型。首先对流量时间序列进行小波分解,得到小波变换尺度系数序列和小波系数序列,以系数序列和原来的流量时间序列分别作为模型的输入和输出,构造人工神经网络并且加以训练。用实际网络流量对该模型进行验证,结果表明,该模型具有较高的预测效果。  相似文献   

7.
提出了一种基于最大隶属度原则的基因表达式编程(Gene Expression Programming,GEP)分类方法MDM-GEP。引入模糊集合中的隶属度描述分类的模糊性,在训练集上得到逼近各类别隶属函数的GEP分类器。对于待分类实例,计算其在各模糊集中的隶属度,基于最大隶属度的模糊模式识别原则确定最终归属类,并在三个UCI数据集上对该算法进行了实验。实验结果表明,MDM-GEP不仅具有较好的分类性能,而且有效解决了传统的简单GEP分类方法中存在的拒分区域问题。  相似文献   

8.
基于密度法的双隶属度模糊支持向量机   总被引:1,自引:0,他引:1  
针对现实环境中样本集越来越大,并且往往含有大量噪声和野值,导致传统模糊支持向量机的训练时间和分类识别率降低的阃题,提出基于密度法的双隶属度模糊支持向量机,即靠近类中心的样本点隶属度由其到类中心的距离确定,远离类中心的样本点隶属度由其邻域内同类异类样本点数量的比例确定。从理论和实证两个方面分析文中方法与以往基于密度的模糊支持向量机(DFSVM)相比,该方法不但降低了算法的复杂度,并且提高了支持向量机的分类精度。  相似文献   

9.
模糊k近质心近邻算法(FKNCN)的分类结果易受噪声点和离群点影响,并且算法对所有样本特征同等对待,不能体现样本特征的差异性。针对这两个问题,提出基于隶属度的模糊加权k近质心近邻算法MRFKNCN。利用密度聚类思想构造新的隶属度函数计算训练样本的隶属度,以减小噪声或离群样本对分类结果的影响。在此基础上,设计基于冗余分析的Relief-F算法计算每个特征的权重,删去较小权重所对应的特征和冗余特征,并通过加权欧氏距离选取有代表性的k个近质心近邻,提高分类性能。最终,根据最大隶属度原则确定待分类样本的类别。利用UCI和KEEL中的多个数据集对MRFKNCN算法进行测试,并与KNN、KNCN、LMKNCN、FKNN、FKNCN2和BMFKNCN算法进行比较。实验结果表明,MRFKNCN算法的分类性能明显优于其他6个对比算法,平均准确率最高可提升4.68个百分点。  相似文献   

10.
为提高医学图像在组织边界不清晰以及灰度不均匀下的分割性能,提出一种基于多类样本间模糊距离的隶属度函数分割方法。通过磁共振序列测量确定反映磁共振图像脑部组织特性的映射图,经预处理后得到样本模糊标签;设计基于多样本类间模糊距离的隶属度函数确定各样本的隶属度,该隶属度的确定综合考虑了同类样本与不同类样本之间的空间距离,降低了同类样本之间的隶属度依赖;训练模糊支持向量机对三种主要脑组织进行分割。在脑图像公开数据集上的分割实验表明,改进算法可有效提高分割精度。  相似文献   

11.
一种新的基于小波变换的多聚焦图像融合算法   总被引:2,自引:1,他引:1       下载免费PDF全文
提出了一种基于小波变换的多聚焦图像融合算法(简记为WMFFA)。首先综合源图像求得参照图像,并对源图像和参照图像分别做小波变换,将其分解成低频和高频图像,然后求出源图像的每个小波系数与参照图像中对应位置上的小波系数之间的距离,按照距离特征从源图像中选取小波系数,组成融合后的小波系数并进行小波反变换,得到融合图像。对提出的融合算法性能进行了评价与分析,结果表明提出的算法对多聚焦图像融合是有效的。  相似文献   

12.
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种。针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM)。由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后, 结合 始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性。理论分析表明,该距离度量满足下界定理。在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAX_SM具有比SAX更优的分类效果。  相似文献   

13.
针对移动云主机负载变化大、难以精准预测的问题,提出一种联合特征选择下基于长短期记忆网络的AR-LSTM-ED负载预测模型,能够对云主机负载进行单步和长时间多步预测。首先采用联合特征选择的方法得到与目标预测负载序列相关的其他负载序列,并且利用适用于在线预测的无抽取的小波变换方法将目标预测特征分解成更加易于预测的子序列。最后将这些序列和目标预测序列一起输入AR-LSTM-ED模型中,AR-LSTM-ED模型利用长短期记忆编-解码网络对目标负载进行预测,具有能够捕捉负载中的长期依赖关系的优点,且进一步结合了自回归模型(AR)以预测负载中的线性数据。在真实的Google云计算数据集上验证算法,对比实验结果表明,本文提出的方法取得了更好的性能。  相似文献   

14.
In recent years, the rapid development of Internet of Things and sensor networks makes the time series data experiencing explosive growth. OpenTSDB and other emerging systems begin to use Hadoop, HBase to store massive time series data, and how to use these platforms to query and mine time series data has become a current research hotspot. As a typical time series distance measurementmethod, correlation coefficient is widely used in various applications. However, it requires a large amount of I/O and network transmission to compute the correlation coefficient of long time sequence on HBase in real time, and therefore cannot be applied to interactive query. To address this problem, in this paper, we present two methods to estimate the correlation coefficients of two sequences on HBase. We first propose a fast estimation algorithm for the upper and lower bounds of correlation coefficient, named as DCE. In order to further reduce the cost of I/O, we extend the DCE algorithm, and propose the ADCE algorithm, which can estimate the correlation coefficient quickly with an iterative manner. Experiments show that the algorithms proposed in this paper can quickly calculate the correlation coefficient of the long time series.  相似文献   

15.
提出了一个带时延的长时间序列线性相关的挖掘算法Mini-Check。先将时间序列变换为Haar小波系数序列,再利用线性相关系数和欧氏距离系数之间的关系过滤,形成两两序列对的结果集,最后只计算这些序列对之间的Pearson相关系数,来判定序列对是否线性相关。与传统方法相比,算法的效率很高。  相似文献   

16.
索引大规模时序数据库是高效时序搜索中的关键问题.提出了一种新颖的索引方案RQI, 它包括3种过滤策略: 即first-k过滤、索引低边界和上边界以及三角不等式修剪.基本的思想为首先运用Haar小波变换计算每个时序的小波系数,利用前面的k个小波系数形成一个最小边界矩阵,以利用点过滤方法;然后将预先计算每个时序的低边界特征和上边界特征存放到索引当中;最后采用三角不等式来修剪不相似的序列并确保没有漏报.同时提出了一种新的低边界距离函数SLBS和聚类算法CSA.通过CSA可保持索引良好的聚类特征以提高点过滤方法的效率,从而引入了一种更好的算法RQIC.在合成数据集和实时数据集的大量对比实验表明,RQIC是有效的且具备较高的查询效率.  相似文献   

17.
Prediction of protein structural class plays an important role in protein structure and function analysis, drug design and many other biological applications. Prediction of protein structural class for low-similarity sequences is still a challenging task. Based on the theory of wavelet denoising, this paper presents a novel method of prediction of protein structural class for the first time. Firstly, the features of the protein sequence are extracted by using Chou’s pseudo amino acid composition (PseAAC). Then the extracted feature information is denoised by two-dimensional (2D) wavelet. Finally, the optimal feature vectors are input to support vector machine (SVM) classifier to predict protein structural classes. We obtained significant predictive results using jackknife test on three low-similarity protein structural class datasets 25PDB, 1189 and 640, and compared our method with previous methods The results indicate that the method proposed in this paper can effectively improve the prediction accuracy of protein structural class, which will be a reliable tool for prediction of protein structural class, especially for low-similarity sequences.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号