共查询到19条相似文献,搜索用时 93 毫秒
1.
2.
基于主从模式的并行关联规则挖掘算法及其应用研究 总被引:2,自引:0,他引:2
文章把数据挖掘技术引入到地震预报领域,研究并行关联规则在地震预报中寻找地震相关地区的应用。针对地震目录数据的特点利用多种剪枝技术,提出一个基于主从模式设计的并行关联规则挖掘算法,取得了较好的运行效率。在寻找地震地区相关性的应用实践中得到了一些有意义的结果。 相似文献
3.
基于Apriori算法的股票分析仿真系统 总被引:6,自引:0,他引:6
为了对中国股票进行数据分析,针对股票市场中的股票价格之间的相关性,提出了一种基于Apriori算法的改进算法.算法在垂直数据表示方式上执行广度优先搜索和交叉计数,充分利用了垂直数据表示和交叉计数的高效优势,以及Apriori算法的剪枝策略,减少了计数的候选项集的数量.并对两种算法进行了性能比较,改进的Apriori算法的运行速度较Apriori算法有明显的提高.最后将新算法应用于股票分析仿真系统,仿真结果表明,改进算法能够得到有意义的规则,快速发现股票之间的涨跌关系,为投资者提供了实时、准确的股票买入还是卖出的决策支持. 相似文献
4.
基于神经网络的股票中期预测 总被引:1,自引:0,他引:1
本文给出了一种基于BP神经网络的股票市场建模、预测以及决策方法.应用神经网络进行股票中期预测,输入数据的复杂性给网络训练效率和预测精度造成了显著的负面影响.我们应用模糊曲线分析法进行了输入变量的筛选,该方法主要是用来压缩输入数据的维度,发现影响产出变量的重要因素.它通过求相关度,贡献弹性,根据样本点拟合样本曲线,最后选取出影响变量的重要因素.结果表明,经该方法处理后的数据输入神经网络不仅减少了输入数据量,使训练时间减少,运算速度提高,而且预测精度有了明显的改善. 相似文献
5.
基于星型网络的分布式关联规则挖掘算法研究 总被引:2,自引:0,他引:2
随着Internet的迅猛发展,分布式数据库得到广泛应用。本文分析了一些主要的分布式数据挖掘算法的优缺点,提出了一种在星形结构下的分布式关联规则挖掘算法(SDAM)。该算法改进了FDM算法,具有通讯量低、并行性及可扩展性好等优点。 相似文献
6.
Apriori和FP-Growth算法是频繁模式挖掘中的经典算法,由于Apriori存在更多缺陷,因此FP-Growth是单机计算环境下比较高效的算法。然而,对于非并行计算在大数据时代遇到的瓶颈,提出一种基于事务中项间联通权重矩阵的负载平衡并行频繁模式增长算法CWBPFP。算法在Spark框架上实现并行计算,数据分组时利用负载均衡策略,存入分组的数据是相应频繁项的编码。每个工作节点将分组数据中每一个事物中项的联通信息存入一个下三角联通权重矩阵中,使用被约束子树来加快每个工作节点挖掘频繁模式时创建条件FP-tree的速度,再用联通权重矩阵避免每次挖掘分组中频繁模式时对条件模式基的第一次扫描。由于联通权重矩阵和被约束子树的结合应用于每一个工作节点的FP-tree挖掘过程,因此提升了并行挖掘FP-tree性能。通过实验表明,所提出的并行算法对大的数据有较高性能和可扩展性。 相似文献
7.
分析了数据挖掘领域面临的性能问题(主要包括算法的有效性、可伸缩性和并行性);根据数据并行的思想,提出了在时序预测中并行训练神经网络的模型,以提高训练速度。这一模型具有良好的可扩展性,能适应大训练集的情况,是一种粗粒度的并行,且易于在集群系统这样的并行环境下进行数据挖掘。同时,描述了相关算法,并对训练速度进行了测试。 相似文献
8.
关联规则在股票分析中的应用 总被引:4,自引:0,他引:4
应用Apriori算法的思想,采用变支持度和变置信度进行股票数据的一维和多维关系的 挖掘。不同于传统的以股票代码作为数据预处理的结果,本文采用股票的交易日期作为预处理的结 果,把交易日期所在的列号作为算法的直接处理对象,把交易日期作为其间接的处理对象。这样可以 方便快捷地挖掘出用户感兴趣的规则,同时也避免了在进行多维数据挖掘时需进行再处理的麻烦。 有代表性规则的验证证实了挖掘结果的正确性。 相似文献
9.
金融市场股票的价格预测是投资者们关心的热门问题,随着股票数据规模以及样本维数的日益庞大,人们对于股票预测算法在保证准确之外的预测速度也提出了更高的要求。在最小二乘支持向量机(LSSVM)股票预测算法的基础上,提出一种适宜支持向量机的GPU并行计算模型。实验证明,新方法不仅可以保证预测的精度,而且可以大大缩短预测时间。该方法可以广泛运用到金融领域的大规模数据处理以及预测中,具有较高的应用价值。 相似文献
10.
1 引言数据开采技术已经引起了国际上人工智能和数据库专家学者的强烈关注,其核心就是要从庞大的数据集里发现知识,为人们管理、决策提供科学依据,而对关联规则的发现一直是数据开采的热门话题,从A-gawal首先提出Agriori算法以来,产生和改进了许多有效的算法和模型。然而,不得不面临的一个现实问题是,面对海量数据以及数据自身、之间复杂的关系、 相似文献
11.
传统的频繁路径挖掘分析主要通过关联规则算法实现,但其在处理大型数据集时,会产生占用内存过多,数据处理速度慢等问题,对此提出一种基于Fuzzy [c]-means聚类算法的并行Apriori算法模型。该模型通过Fuzzy [c]-means算法完成对原始数据集的聚类分析,将同一区域的物流路径数据划分到内部相似度较高的数据类,并利用Apriori算法对各数据类中的频繁模式进行挖掘分析,进而获得各区域的物流频繁路径。同时通过Hadoop平台实现算法的并行化,有效提高算法运行效率和质量。通过对物流频繁路径的挖掘分析,使管理者更清楚货物流向,可为配送路径优化等决策提供支持。 相似文献
12.
13.
14.
基于遗传BP网络的股市预测模型研究与仿真 总被引:2,自引:12,他引:2
股票价格走势已经成为人们关注的焦点,为了更精确的预测股票价格,得到更合理的股票投资意见,利用遗传算法全局寻优和BP神经网络局部寻优相结合的方法.提高了传统BP神经网络的计算精度和收敛速度.建立了基于遗传BP网络的股市预测系统模型,对贵州茅台股票价格进行预测.仿真结果表明,经遗传算法改进后的BP神经网络模型在降低计算和预测的平均误差的同时,迭代次数比一般BP神经网络模型也大大减少.因此适用于求解如股市预测等非线性问题,具有较高的精确度和应用价值. 相似文献
15.
大规模并行网络模拟已成为目前研究Internet的主要方法,针对传统网络拓扑划分方法划分不均衡的问题,提出基于抽象消减和流量估计的并行网络模拟拓扑划分算法.采用抽象消减技术,将拓扑中度为1的节点递归抽象到其相连路由器上;采用流量估计技术,首先对拓扑中所有节点和链路利用估计算法进行权值初始化,然后将节点间流量转换为节点间权值,并将相应节点和链路的权值进行叠加.同时为避免权值差距过大,对权值进行规范化处理.实验结果表明,该划分算法相对于传统划分算法,节点压缩率在93.7%以上,缩减子域数约56.9%,减少远程链路数约22.9%,减少模拟时间约12.63%,提高了模拟的规模和效率. 相似文献
16.
Hadoop平台上Apriori算法并行化研究与实现 总被引:1,自引:0,他引:1
分析传统串行关联规则Apriori算法的计算过程以及存在的一些缺点,针对串行算法执行效率低,时间复杂度高以及传统并行计算模式不能处理节点失效,难以处理负载均衡等问题,提出基于Hadoop平台实现并行关联规则算法的设计方法,对传统关联规则Apriori算法进行了改进,并给出改进算法在Hadoop平台的MapReduce编程模型上的执行流程;在Hadoop平台上对改进后的算法进行单机测试和集群测试,实验结果证明,改进后的算法具有较高的执行效率,良好的加速比和可移植性。 相似文献
17.
股票指标数据种类多、维度高,且指标之间存在多重共线性。为了降低数据的维度、消除指标间的多重共线性和预测股票价格,首先构建了基于受限布尔兹曼机的深度自编码器,实现了高维数据向低维空间的压缩编码。然后基于BP神经网络建立了低维编码序列与股票价格之间的回归模型。实验结果表明,深度自编码器提取特征的能力优于主成分分析法和因子分析法;相比较使用降维前的数据,使用编码后的数据用预测股票价格,模型可以减少计算开销,并且获得更高的预测精度。 相似文献
18.
针对股票价格具有非线性、非平稳的特点,提出一种结合自注意力机制和残差网络的生成式对抗神经网络模型(SAR-GAN)。该模型的生成器(generator)由长短期记忆网络(LSTM)层、自注意力机制层、残差层等构建而成,用于生成所预测股票的价格;判别器(discriminator)用于鉴别生成的股票价格与真实的股票价格。为验证模型良好的泛化性,选取上证指数及不同股票市场的热点行业龙头股票进行预测实验。实验结果表明,与LSTM、GRU、CNN-LSTM、CNN-GRU等模型相比,SAR-GAN模型能不同程度地减少预测误差。 相似文献
19.