支持向量回归机使用由经验误差项和常数项所构成的风险函数,满足结构风险最小原则。在时态数据预测领域,它将成为一种很有前途的预测方法。简要介绍了回归支持向量机的基本理论。基于回归支持向量机模型,建立了一个对时态数据预测的方法,可以对多属性时态数据进行预测,并与其它预测模型(BP神经网络)进行比较。实验结果表明所提出的方法在预测的稳定性和准确性方面都要优于BP神经网络模型。  相似文献   

针对股票价格构成的时间序列具有随机性与偶然性,传统的单一模型很难满足建模要求的问题,提出一种基于小波和神经网络相结合的股票预测模型.将股票价格进行小波分解成尺度不同的分层数据,分别利用Elman神经网络预测各层数据,将各层的预测结果使用BP神经网络合成最终预测结果.通过实际的股票价格对该模型进行验证,结果表明,该组合模型具有较高的预测效果,可以提高股票价格预测的准确率.  相似文献   

聚类是数据挖掘研究中最常见的一种方法,可以作为规则发现、异常发现等其它数据挖掘操作的基础,一直以来都是数据挖掘的研究热点之一。股票数据是一种典型的时间序列数据,利用股票数据进行时间序列数据挖掘的研究既有一定的实际应用价值,也是国内外的热点问题之一。文章首次将一种新型符号化方法SAX[1]应用到标准普尔500指数的股票数据的聚类研究中,使用传统的欧氏距离和动态时间弯曲两种时间序列相似性度量方法进行实验。实验结果表明将SAX应用到股票数据聚类操作,可以得到更好的趋势聚类效果和更高的效率。  相似文献   

分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型。该函数或模型能够把数据库中的数据记录映射到给定类别中的某一个,从而可以应用于数据预测。大部分数据挖掘工具采用规则发现或决策树分类技术来发现数据模式和规则,其核心是某种归纳算法。这类工具通常是对数据库的数据进行开采,生产规则和决策树,然后对新数据进行分析和预测。本文研究基于SLIQ的数据挖掘分类算法。  相似文献   

基于时间序列的支持向量机在股票预测中的应用   总被引:1,自引:0,他引:1  
由于股票预测是不确定、非线性、非平稳的时间序列问题,传统的方法往往难以取得满意的预测效果。本文提出一种基于时间序列的支持向量机(SVM)股票预测方法。利用沙河股份的股票数据,建立股票收盘价回归预测模型,该模型克服了传统时间序列预测模型仅局限于线性系统的情况。实验结果表明,该方法比神经网络方法以及时间序列方法的预测精度更高,可以很好的应用某些非线性时间序列的预测中。  相似文献   

分类问题是数据挖掘中的一个重要问题。尽管神经网络是一种高精度的分类器,但是由于神经网络模型众多,在分类预测时如何选择合适的模型,还没有一个普遍的原则。文章对后传播神经网络(BPN)和概率神经网络(PNN)在数据挖掘分类中的应用进行了对比研究,并利用这两种模型对高校研究生信息进行了分类挖掘。仿真结果证明,PNN模型在分类预测上优于BPN模型,而且其分类速度快、正确率高、测试结果稳定。  相似文献   

基于神经网络型数据挖掘技术的股价预测   总被引:2,自引:0,他引:2  
提出适用于神经网络型数据挖掘的过程模型.按照选取数据样本、数据转换、网络建模、网络仿真、结果评价这样一个完整的数据挖掘过程,对上证指数走势进行预测,得到了较高的预测精度.说明了神经网络型数据挖掘技术在非线性系统预测中的优势,探讨了非线性系统预测的一种新思路.  相似文献   

随着社会经济的发展,数据量在日益增加,为了能够在庞大的数据中挖掘出有价值的信息,通过历史数据的潜在规律推测未来已经成为数据挖掘领域内重要的部分.本文通过研究MLP、BP及MLBP模型并进行模型的误差对比分析,并将最优模型应用于股票预测.实验数据通过调用Python提供的Tushare财经数据接口进行股票日交易数据的爬取,应用三种模型对股票交易数据进行分析处理,不断进行调参,并将预测结果使用MSE进行误差比较,最后得出一个最优的预测值.  相似文献   

AFC系统的核心是票/卡售检票自动处理.为保证AFC系统正常运营,需要定期或按需执行票/卡调配.把时序数据分析技术与数据挖掘理论相结合,建立了适合数据挖掘中径向基函数神经网络的输入样本模型.该模型能够通过反复学习从时序数据中发现潜在的规律,并将其用于轨道交通客流量的短期预测.预测结果表明比采用BP神经网络模型的预测结果精度更高、效果更好.  相似文献   

时态数据挖掘的相似性发现技术   总被引:20,自引:0,他引:20  
潘定  沈钧毅 《软件学报》2007,18(2):246-258
现实世界存在着大量的时态数据,时态数据挖掘(temporal data mining,简称TDM)是近年来学术界关注的一个重要研究课题.相似性发现技术关注数据的发展变化,试图从时态数据中发现事物动态演化的相似性规律.分析和比较了近年来TDM研究中涉及的主要相似性发现技术.首先区分定义了3类时态数据:时间序列、事件序列和交易序列;然后分类并讨论了各种与序列相关的主要方法和技术,涉及相似性度量、序列抽象表示和搜索,以及各类挖掘任务及其算法操作;最后展望进一步研究的方向.  相似文献   

针对传统时间序列分类方法需要较为繁琐的特征抽取工作以及在只有少量标记数据时分类效果不佳的问题,通过分析BP神经网络和朴素贝叶斯分类器的特点,提出一种基于BP和朴素贝叶斯的时间序列分类模型。利用了BP神经网络非线性映射能力和朴素贝叶斯分类器在少量标记数据下的分类能力,将BP神经网络抽取到的特征输入到朴素贝叶斯分类器中,可以较为有效的解决传统时间序列分类算法的问题。实验结果表明,该模型在标记数据较少的情况下的时间序列分类中具有较高的分类准确度。  相似文献   

对于现实的复杂网络而言,有连边的节点对数目通常远小于无连边的节点对数目,在链路预测时,不同类别的样本数量不平衡会导致预测的分类结果与真实情况有较大的偏差。针对此问题,本文提出更优的链路预测算法,先对网络拓扑信息进行特征提取,再设计出一种集成分类器对数据样本进行平衡处理,然后基于网络的拓扑信息改进了分类器的集成规则,最后将训练出的集成分类器同现有的4个针对不平衡分类的链路预测学习算法进行对比研究。通过对4个不同规模的时序网络进行链路预测,结果表明:本文的链路预测学习算法具有更高的召回率,同时也保证了预测结果的准确性,从而更好地解决了链路预测中因类别不平衡导致的误分类问题。  相似文献   

Data classification is an important topic in the field of data mining due to its wide applications. A number of related methods have been proposed based on the well-known learning models such as decision tree or neural network. Although data classification was widely discussed, relatively few studies explored the topic of temporal data classification. Most of the existing researches focused on improving the accuracy of classification by using statistical models, neural network, or distance-based methods. However, they cannot interpret the results of classification to users. In many research cases, such as gene expression of microarray, users prefer the classification information above a classifier only with a high accuracy. In this paper, we propose a novel pattern-based data mining method, namely classify-by-sequence (CBS), for classifying large temporal datasets. The main methodology behind the CBS is integrating sequential pattern mining with probabilistic induction. The CBS has the merit of simplicity in implementation and its pattern-based architecture can supply clear classification information to users. Through experimental evaluation, the CBS was shown to deliver classification results with high accuracy under two real time series datasets. In addition, we designed a simulator to evaluate the performance of CBS under datasets with different characteristics. The experimental results show that CBS can discover the hidden patterns and classify data effectively by utilizing the mined sequential patterns.  相似文献   

Stock trend prediction is regarded as one of the most challenging tasks of financial time series prediction. Conventional statistical modeling techniques are not adequate for stock trend forecasting because of the non-stationarity and non-linearity of the stock market. With this regard, many machine learning approaches are used to improve the prediction results. These approaches mainly focus on two aspects: regression problem of the stock price and prediction problem of the turning points of stock price. In this paper, we concentrate on the evaluation of the current trend of stock price and the prediction of the change orientation of the stock price in future. Then, a new approach named status box method is proposed. Different from the prediction issue of the turning points, the status box method packages some stock points into three categories of boxes which indicate different stock status. And then, some machine learning techniques are used to classify these boxes so as to measure whether the states of each box coincides with the stock price trend and forecast the stock price trend based on the states of the box. These results would support us to make buying or selling strategies. Comparing with the turning points prediction that only considered the features of one day, each status box contains a certain amount of points which represent the stock price trend in a certain period of time. So, the status box reflects more information of stock market. To solve the classification problem of the status box, a special features construction approach is presented. Moreover, a new ensemble method integrated with the AdaBoost algorithm, probabilistic support vector machine (PSVM), and genetic algorithm (GA) is constructed to perform the status boxes classification. To verify the applicability and superiority of the proposed methods, 20 shares chosen from Shenzhen Stock Exchange (SZSE) and 16 shares from National Association of Securities Dealers Automated Quotations (NASDAQ) are applied to perform stock trend prediction. The results show that the status box method not only have the better classification accuracy but also effectively solve the unbalance problem of the stock turning points classification. In addition, the new ensemble classifier achieves preferable profitability in simulation of stock investment and remarkably improves the classification performance compared with the approach that only uses the PSVM or back-propagation artificial neural network (BPN).  相似文献   

相较于传统的图数据分析方法,图嵌入算法是一种面向图节点的新型图数据分析策略.其旨在通过将图节点向量化表达,进而在节点向量基础上利用神经网络相关技术更有效的进行图数据分析或挖掘工作,如在节点分类、链接预测及交通流预测等经典问题上取得效果显著.虽然研究者们在图嵌入方面已取得了诸多成果,但是面向时序图的节点嵌入问题却未被充分重视,本文便是在先前研究工作的基础上,结合信息在时序图中的传播特性,提出了一种对时序图节点进行自适应嵌入表达的方法ATGEB (Adaptive Temporal Graph Embedding).首先,为了解决不同类型时序图节点活跃程度不同的问题,通过设计一种自适应方式对其活跃时刻进行聚类.而后,在此基础上设计一种游走模型用以保存节点对之间的时间关系,并将节点游走序列保存在一种双向多叉树上进而可以更快速的得到节点时间相关的游走序列.最后,在基于节点游走特性和图拓扑结构的基础上,对节点向量进行重要节点采样,以便在尽可能短的时间内训练出满足需求的网络模型.通过充分的实验证明,本文面向时序图的嵌入策略相较于现流行的嵌入方法,在时序图时序中节点间时序可达性检测以及节点分类等问题上得出了更好的实验效果.  相似文献   

基于模糊高斯基函数神经网络的遥感图像分类   总被引:8,自引:0,他引:8  
针对遥感图像分类的特点,提出了一种基于模糊高斯基函数神经网络的遥感图像分类器。该分类器将模糊技术与神经网络相结合,采用神经网络来实现模糊推理,利用神经网络的学习能力来达到调整模糊隶属函数和模型规则的目的,从而使系统具备了自适应的特性,实验结果表明,这种基于模糊高斯基孙数神经网络的分类器经过训练后,可应用于遥感图像的分类,其分类精度明显高于传统的最大似然分类法。  相似文献   

王娇  王雄  熊智华 《计算机工程》2006,32(5):183-185
针对丙酮精制过程的特点,提出一种基于神经网络的丙酮产品质最分类挖掘方法。首先,讨论了数据挖掘中自变量筛选的方法,包括相关性分析、Fisher指数分析、主成分回归分析以及偏最小二乘回归分析等,综合各种疗法分析的结果,对丙酮精制过程中众多的工艺影响因素进行了重要性排序并据此筛选出重要的自变量;以选入的变量作为输入变量,构造基于神经网络的产品质量分类器。实验结果表明,训练后的神经网络分类器在丙酮产品质量分类挖掘中取得了良好的效果。  相似文献   

混沌理论在股票价格预测中的应用   总被引:3,自引:0,他引:3  
针对股票时间序列的非线性特点,结合混沌理论和神经网络理论,提出了基于混沌理论的股票价格神经网络预测方法。同时利用重构相空间的嵌人维数确定神经网络的结构,对实际的股票时间序列预测结果表明,该方法能有效地进行短期预测,在股票时问序列预测中有广泛的实用价值。  相似文献   

提出一种基于RBF神经网络的数据挖掘方法,将RBF神经网络应用于数据挖掘的分类和预测中,解决钢构件过程中的性能预测问题。其中用黄金分割法确定基于RBF神经网络的隐层节点数,减少该算法的计算复杂度,最终将其应用于某钢铁企业质量控制系统。构建对钢构件质量检测的数据挖掘及质量追溯平台,该平台是基于RBF神经网络的数据挖掘技术的。实际应用证明,产品的质量合格率可达到96.27%,符合国家相关的标准和技术指标。  相似文献   

In cloud classification from satellite imagery, temporal change in the images is one of the main factors that causes degradation in the classifier performance. In this paper, a novel temporal updating approach is developed for probabilistic neural network (PNN) classifiers that can be used to track temporal changes in a sequence of images. This is done by utilizing the temporal contextual information and adjusting the PNN to adapt to such changes. Whenever a new set of images arrives, an initial classification is first performed using the PNN updated up to the last frame while at the same time, a prediction using Markov chain models is also made based on the classification results of the previous frame. The results of both the old PNN and the predictor are then compared. Depending on the outcome, either a supervised or an unsupervised updating scheme is used to update the PNN classifier. Maximum likelihood (ML) criterion is adopted in both the training and updating schemes. The proposed scheme is examined on both a simulated data set and the Geostationary Operational Environmental Satellite (GOES) 8 satellite cloud imagery data. These results indicate the improvements in the classification accuracy when the proposed scheme is used.  相似文献   

