首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
基于上证A股的每日、周、月行情数据建立数据库系统,采用统计方法进行数据挖掘研究,挖掘研究不同时间范围、时间刻度和股票行业对股票收益率分布的影响. 从单只股票截面,对股票收益率密度分布进行正态性检验,分析其分布特征与股票流通市值、股票行业类别以及所研究的时间刻度(日、周、月)的关系. 从单位时间截面,对股票集合的收益率均值和波动率的相关统计特征进行分析,研究结果表明,股票集合的收益率均值的方差远大于单只股票截面的收益率均值的方差,这是因为股票之间的相关性远大于时间之间的相关性;另外,股票集合的波动率还具有长期记忆性的特征.  相似文献   

2.
股票技术分析是证券分析的常用手段之一,目前的股票技术分析主要存在2个问题:1)都是从某个角度进行单维度分析,投资决策有较大偏差;2)任何单一的技术指标都有其局限性,需要相互补充才能更好进行投资决策。针对这些问题,本文讨论如何利用数据挖掘技术进行股票多维度综合分析问题。首先,分析数据挖掘应用到股票分析中可以解决的问题及可能面临的挑战;其次,提出一种基于数据挖掘聚类方法的选股模型;最后,对1364只上证股票进行实证分析,形成对股票的随机指标K、D、J等的综合挖掘结果。  相似文献   

3.
聚类是数据挖掘研究中最常见的一种方法,可以作为规则发现、异常发现等其它数据挖掘操作的基础,一直以来都是数据挖掘的研究热点之一。股票数据是一种典型的时间序列数据,利用股票数据进行时间序列数据挖掘的研究既有一定的实际应用价值,也是国内外的热点问题之一。文章首次将一种新型符号化方法SAX[1]应用到标准普尔500指数的股票数据的聚类研究中,使用传统的欧氏距离和动态时间弯曲两种时间序列相似性度量方法进行实验。实验结果表明将SAX应用到股票数据聚类操作,可以得到更好的趋势聚类效果和更高的效率。  相似文献   

4.
随着证券市场的迅猛发展,股票数据信息爆炸式增长,如何从庞大的敷据中找到有用的信息来指导投资者的投资行为成为一个重要的学术研究方向.从数据挖掘技术入手,在关联规则分析的处理算法基础上,引入股票成交量数据项以及二雏时间模式对股票敷据进行数据挖掘,并对比试验的结果.试验证明,该改进时投资者提供了更为有效的决策支持.  相似文献   

5.
对具有时间属性的数据进行数据挖掘称为时态数据挖掘,用以发现数据在时间上的知识,当数据变化不规律时,如股票交易数据,就很难发现有价值的规律与规则。而神经网络具有并行、容错、可以硬件实现以及自我学习的优点,可作为股票分类预测应用的一种方法。通过将股票数据与时态型相结合,将股票数据转换成时态型股票数据,提出时态神经网络模型的分类方法,对收集的若干上市公司十年内的股票数据进行分析,构建了时态股票数据神经网络分类器对股票进行分类预测。经过实验验证,相比改进前的神经网络和支持向量机方法,该分类器具有更高的分类准确率。结果证明,这种时态数据神经网络模型对于多只股票的分类预测是非常有效的,可以很好地运用到股票市场的分类预测中。  相似文献   

6.
关于股票准确预测问题,针对股票预测中计算时间复杂度大,数据库操作速度慢等缺点,为提高数据挖掘的速度和效率,提出了一种分割提速法的并行股票预测模型。模型特点采用广播拓扑结构,使用多线程并行计算方法,将计算量平均分配给所有参与计算的计算机,同时又使用网络编程技术实时同步回收结果,从而有效地缩短了股票关联规则的计算时间。实验结果表明,上述方法有效地减少了算法时间复杂度,较大程度地提高了股票预测的效率,从而为股票投资者提供有力的帮助。  相似文献   

7.
李文娟 《信息与电脑》2011,(10):180-181
在高职高专的计算机应用基础课教学中,利用Excel电子表格进行数据挖掘是最能体现学以致用的教学原则的。本文介绍了把股票买卖的定价问题研究作为项目教学目标直接引入了计算机课堂,使用电子表格进行数据挖掘,找出股票价格变动规律和给股票的买卖进行科学定价的具体做法。  相似文献   

8.
本文针对股价这样一个随机事件的概率分布进行预测的问题,使用数据挖掘中决策树分类的算法,从股票技术上分析预测股价波动趋势,为其提供一个选择的指标。通过对股票数据的处理,计算信息增益,及各指标信息增益的比较,可以知道"成交量"这一指标更适合做为股票幅度预测的指标,这可以作为实际股票幅度预测与分析问题的参考[1-6]。  相似文献   

9.
由于股市内的数据的庞大和复杂,在进行有效的股票数据分析的时候我们需要更加精确的数据来为我们服务,基于以上股市数据的特点,利用数据挖掘技术对股市趋势的计算是符合实际的,在BP神经网络算法的基础上对股票分析系统进行设计。  相似文献   

10.
该文分析了数据挖掘的概念,探讨了辅助决策系统以及数据挖掘之间的整合方法,并研究了数据挖掘及辅助决策系统在物联网当中的应用情况,包括物联网模型架构,数据挖掘及其算法的选择,辅助决策系统以及数据挖掘应用的具体过程等。  相似文献   

11.
High-frequency financial data are useful for studying the statistical properties of asset returns at lower frequencies, and they have been widely used to study various market microstructure related issues. However, most studies to date have been concentrated on markets in developed economies such as the stock markets in US or UK. This article aims to investigate the statistical properties of stock return volatility in Hong Kong. Using the sample of constituent stocks of Hang Seng Index (HSI) and Hang Seng China Enterprises Index (HSCEI or “H-shares Index”), we found that the mean daily realized volatilities of HSCEI stocks to be significantly higher than their HSI counterpart, while the correlations between H-shares stay relatively lower than that of HSI stocks. A long-memory effect is also reported for the logarithmic standard deviations of all shares, with most of them showing slow decay over the series.  相似文献   

12.
交易模型的稳健性,指的是该模型的利润率曲线的波动性较小,没有大起大落。针对一个基于支持向量回归(SVR)技术的算法交易模型的稳健性问题,提出了使用若干导出指标训练统一的交易模型的策略,以及投资组合多样化的方法。首先,介绍基于支持向量回归技术的算法交易模型;然后,基于常用指标,构造了若干导出指标,用于股票价格的短期预测。这些指标,刻画了近期价格运动的典型模式、超买/超卖市场状态,以及背离市场状态。对这些指标进行了规范化,用于训练交易模型,使得模型可以泛化到不同的股票;最后,设计了投资组合多样化方法。在投资组合里,各个股票之间的相关性,有时会导致较大的投资损失;因为具有较强相关关系的股票,其价格朝相同方向变化。如果交易模型预测的价格走势不正确,引起止损操作,那么这些具有较强相关关系的股票,将引发雪崩式的止损,于是导致损失加剧。把股票根据相似性聚类到不同类别,通过从不同聚类类别中选择若干股票来构成多样化的投资组合,其中,股票的相似性,通过交易模型在不同股票上近期的利润曲线的相似度进行计算。在900只股票10年的价格大数据上进行了实验,实验结果显示,交易模型能够获得超过定期存款的超额利润率,年化利润率为8.06%。交易模型的最大回撤由13.23%降为5.32%,夏普指数由81.23%提高到88.79%,交易模型的利润率曲线波动性降低,说明交易模型的稳健性获得了提高。  相似文献   

13.
传统的股票预测方法大多基于时间序列模型,忽视了股票之间复杂的关系,并且该关系往往超出成对连接,例如同行业板块内股票或者基金持仓多支股票.针对该问题,提出一种基于时序超图卷积神经网络(HGCN)的股价走势预测方法,根据金融投资事实构造超图模型以拟合股票之间的多元关系,该模型包括两大组件:门控循环单元(GRU)网络和超图卷...  相似文献   

14.
Web的迅猛发展使其成为全球信息传递与共享日益重要和最具潜力的资源。对于内容由许多源数据库导出的大型Web站点来说,保持自身的时新性是非常重要的一项任务。这一点对于那些提供快速变化信息,如股票交易信息和产品信息的网站来讲尤为突出。本文介绍一种名为MOST(Maintain On Status Transfer)的算法,它把数据库导出的半动态页面分为四种状态,不同状态的页面有着不同的使用和维护规则,页面根据访问情况和基础数据变化情况进行状态迁移。实验数据表明,MOST算法对于更新和访问都比较频繁的Web环境具有较好的适应性,性能优于纯物化算法和Mod算法。  相似文献   

15.
Stocks with similar financial ratio values across years have similar price movements. We investigate this hypothesis by clustering groups of stocks that exhibit homogeneous financial ratio values across years, and then study their price movements. We propose using cross-graph quasi-biclique (CGQB) subgraphs to cluster stocks, as they can define the three dimensional (3D) subspaces of financial ratios that the stocks are homogeneous in across the years, and they can also handle missing values that are rampant in the stock data. Furthermore, investors can easily analyze these 3D subspaces to explore the relations between the stocks and financial ratios. We develop a novel algorithm, CGQBminer, which mines the complete set of CGQB subgraphs from the stock data. Through experimental analysis, we show that the hypothesis is valid. Furthermore, we demonstrate that having an investment strategy which uses groups of stocks mined by CGQB subgraphs have higher returns than one that does not. We also conducted an extensive performance analysis on CGQBminer, and show that it is efficient across different 3D datasets and parameter settings.  相似文献   

16.
A nonlinear dynamic model for the quotes issued by Nasdaq dealers is considered. The model focusses on the top two electronic communication networks (ECNs), Island and Instinet, and the three most active market makers for a sample of twenty stocks. The model extends the standard linear vector error correction model for price discovery in three different ways. First, quote adjustments are set relative to the inside quote, i.e. the best bid and ask in the market. Second, dealers react to the inside spread. Third, adjustments differ according to which dealer is currently at the inside. Adjustments are different if an ECN is currently at the inside compared to an individual dealer. This difference is attributed to the asymmetric information among dealers. Price discovery dynamics are studied using generalized impulse response functions.  相似文献   

17.
文章分析了煤炭企业物资供应管理的现状,针对目前物资管理部门普遍存在的库存储备量过大、占用资金过多、资金利用和周转率不高、物资的进出仓工作量大、且容易出错、经济效益低等诸多问题,指出了在管理工作中引入数据挖掘技术进行科学管理的重要性,并介绍了煤炭企业物资供应数据仓库的构建技术及其应用的数据挖掘技术。  相似文献   

18.
我国证券市场中高送转题材股备受中小投资者的追捧,但市场中也存在着借高送转概念炒作的乱象,如何利用上市公司的财务数据挖掘真正有潜力的股票无疑具有重要意义。采用2?158家制造业上市公司7年的财务指标作为研究数据,利用采样、特征选择以及集成学习算法构建上市公司高送转预测模型并进行实证研究。结果显示:采样和特征选择方法均能有效提高集成预测模型的性能;相较于数据集中的冗余信息,数据不平衡问题对模型预测准确率的影响更显著;ADASYN+mRMR+XGBoost组合模型取得了最好的预测结果,高送转样本的分类准确率达到84.96%,建议投资者优先选用该组合模型对上市公司的高送转情况进行预测。  相似文献   

19.
股票预测通常被形式化为非线性的时间序列预测任务,但很少有研究者试图通过技术面数据去系统地揭示股票市场内在结构,例如股票上涨或下跌背后的原因可能是业务领域之间的合作或冲突,这些额外信息的增加有助于判断股票的未来趋势。为了充分真实刻画股票市场的交易状态,表达股票之间显式或隐式的关系,提出一种基于动态异构网络的股价预测模型sDHN(stock dynamic heterogeneous network),综合股票以及所属行业和地域,将其建模为动态异构网络。该模型在网络上引入动态时序特征,创新融合股票节点的四种不同技术层面的相似性图,生成富信息异构图,最后聚合不同元路径中隐含的语义信息生成嵌入,从异构图的角度充分探索股票之间的潜在关联。此外,在三个真实世界的股票数据集上进行了大量实验,所提出的模型准确率比所有基线模型均高出5%~34%,F1-score则高出11.5%~37%,并且在图解释上证明了该方法的有效性。  相似文献   

20.
对于在深圳证券交易所上市的公司,通过分析和挖掘其季度报表或者相关交易网站中的数据,提取到排名预测任务中相关的数据特征以及通过爬虫获得的文本特征,成功构建了公司每股收益预测排名的模型,实现了对股价收益排名的合理预测.实验结果表明,我们的提出的模型能够有效的提高股价排名预测任务的性能,其中SPRP-Random Forests模型在NDCG@10评价指标中可以达到0.9583.在为股民选择股票,公司经营模式调整等方面具有一定的实用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号