首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
研究了一种新的增量数据挖掘方法,通过对交易数据项集进行编码后,把原始数据转换成整数值随机变量序列,得到该序列为马尔可夫链,利用频率代替转移概率,建立了一个趋势分析的模型。通过对超市销售数据的分析表明,该方法具有简单、实用的特点,得到了顾客对同一产品的不同品牌的选择是没有差别的。  相似文献   

2.
为更好地对股票数据进行分析,从理论上对数据挖掘中时间序列的产生、应用进行了研究,通过对时间序列处理以及相关性搜索的多种方法的比较和分析,设计一个以股票预测为对象的小型系统。该系统首先对时间序列进行适当的处理,然后进行相似性搜索,分析未来的短时间的走势是否是历史上的重现。同时对得到的结果进行了分析,实验结果表明,该方法能找到股票数据中历史上相似走势,并通过历史走势分析当前的走势。  相似文献   

3.
目的采用粗糙集中的属性依赖度分析方法对胶合板缺陷检测数据进行分析,获得各属性对决策的不同作用,并得出各属性间的依赖关系.方法采用粗糙集属性依赖度分析方法对实验数据进行有效分析,挖掘出对决策分析影响大的属性,去掉对决策分析影响小的冗余属性,构造数据挖掘模型.结果从胶合板缺陷检测数据中挖掘出各属性对决策分析的影响程度以及各有关属性间依赖关系的知识,在胶合板缺陷检测数据集的17个属性中,得到了3个重要属性,5个对决策影响较小的属性.结论基于粗糙集属性依赖度的数据挖掘方法提高获取规则的快速性,降低计算的复杂度,增强规则的可解释性,取得良好的研究结果.  相似文献   

4.
分类算法是时间序列数据挖掘中极为重要的任务和技术,该文提出一种基于簇中心群的时间序列数据分类方法。该方法根据时间序列训练数据集中的类别标签进行簇划分,利用近邻传播算法分别对每个簇进行中心代表点选择,构造出各代表点的代表对象集;然后借助基于动态时间弯曲的均值中心方法对各代表对象集实现中心群计算,结合改进后的K近邻算法实现时间序列数据的分类。数值实验结果表明,与传统方法相比,新方法具有更好的分类效果和计算性能。  相似文献   

5.
时间序列分类是数据挖掘中的重要主题,现有的大部分时间序列分类方法较少考虑到序列形状对分类结果的影响。该文提出了一种基于k-shape的时间序列模糊分类方法。该方法通过使用k-shape聚类算法对时间序列训练数据集各类别的成员进行聚类,获得各类别的聚类中心并形成聚类中心群,将每个类别的聚类中心群作为时间序列数据模糊分类的初始聚类中心,根据隶属度最大原则确定测试时间序列数据的类别标签。在30个时间序列公开数据集上的分类实验结果表明,该方法相较于SVM、Bayes、EAIW和TLCS这4种分类算法具有更好的分类性能,对具有扭曲和位移特征的时间序列数据分类有更好的可用性。  相似文献   

6.
为了消除奇异值对系统模型辨识的影响,并提高时间序列数据预处理的效果,提出一种基于统计分析的奇异值检测方法.该方法将时间序列信号变化特征与统计学理论相结合,在计算时间序列信号的变化速率的基础上,对其进行统计分析,进而得到异常值发生的位置,并利用内插法对原始的观察信号进行修复.应用结果表明:该算法简单、有效、计算量小,能满足时间序列数据预处理的需求.  相似文献   

7.
小波变换的离群时序数据挖掘分析   总被引:1,自引:0,他引:1  
针对时序数据进行离群数据挖掘方法的研究。通过对时序数据进行离散小波变换,将其从时域空间变换到频域空间,使时序数据映射为多维空间的点。该方法具有多尺度、时移不变性等特点,经离群时间序列进行离散小波变换后,不仅具有良好的保距性又达到降低维数目的。然后提出一种基于距离的离群时序数据挖掘算法。仿真试验表明了该方法的有效性。  相似文献   

8.
根据对跨国公司商品销售预测统计量的描述,结合了数学模型,利用了马尔柯夫链的一些性质进行分析。结果表明:利用该方法分析得到的跨国公司商品销售预测与给定的目标期望函数较一致,适用于目前对跨国公司商品销售量预测的研究。  相似文献   

9.
针对多元时间序列半监督回归只考虑样本间空间关系信息而忽略了样本间时域信息的问题,提出了一种考虑样本间时域信息的半监督回归算法(ST-LapRLSR).在时域光滑性假设下,构造了一种能更好地反映样本间内蕴几何结构的正则化项.在建立图拉普拉斯的过程中,将样本点间的时序关系引入到边的权重计算中,并在流形正则化框架下利用该正则化项进行半监督回归,最后通过表示定理进行求解.在公共数据集和煤矿多传感器数据上进行了实验,结果表明:在多元时间序列半监督回归中,与只考虑样本空间关系信息的最小二乘正则化算法(LapRLSR)相比,ST-LapRLSR能同时利用样本的时空信息,准确率得到了提高.  相似文献   

10.
一种基于混合模型的时间序列数据挖掘系统   总被引:3,自引:0,他引:3  
时间序列数据挖掘是在从数据仓库中提取出有效历史数据的基础上,对其进行一定的处理,从而发现隐含、未知的有效信息.本阐述了一种新的基于灰色—回归—模糊神经网络混合模型的时间序列数据挖掘系统,重点讨论了灰色—回归—模糊神经网络混合模型的建立过程,并应用于浙江省可持续发展预测,取得了满意的结果.该混合模型融合多种智能计算方法优点于一体,为时序数据挖掘提供了一种新的实用方法.  相似文献   

11.
为了提高优惠券的使用率,提出了一种新的优惠券促销定价模型及求解方法.通过分析优惠券销售的特点,把顾客分为有优惠券的顾客和没有优惠券的顾客两种类型,考虑优惠券面值和发放时间两个因素,以商家利润差最大化为目标建立了发放优惠券的定价模型,利用商务智能中的数据挖掘技术对商场中进行促销的几种商品的销售量进行了预测,并利用遗传算法对模型进行优化求解,通过实例仿真进行了验证.实验结果表明,该模型对于商家制订优惠券策略具有重要的理论意义和应用价值.  相似文献   

12.
根据就业数据的特点,采用C4.5决策树算法对就业数据进行预处理,选取决策属性,实现挖掘算法并抽取规则知识,由规则知识指出哪些决策属性决定了就业单位的类别.挖掘结果表明,该算法能够正确将就业数据分类,并得到若干有价值的结论,供决策分析.  相似文献   

13.
基于关联分析的数据挖掘在体检CRM中的应用   总被引:2,自引:0,他引:2  
运用关联分析方法对体检中心数据进行挖掘。首先分析了关联规则的原理和方法,然后对待挖掘数据进行集成、变换等预处理,得到能进行挖掘的原始数据.采用挖掘工具WEKA,选用关联规则中的Apriori算法对处理后数据进行分析,得到了与某一病症相关的各个症状之间的关联关系,以及各个症状与健康之间的关联关系。  相似文献   

14.
According to the chaotic and non-linear characters of power load data, the time series matrix is established with the theory of phase-space reconstruction, and then Lyapunov exponents with chaotic time series are computed to determine the time delay and the embedding dimension. Due to different features of the data, data mining algorithm is conducted to classify the data into different groups. Redundant information is eliminated by the advantage of data mining technology, and the historical loads that have highly similar features with the forecasting day are searched by the system. As a result, the training data can be decreased and the computing speed can also be improved when constructing support vector machine (SVM) model. Then, SVM algorithm is used to predict power load with parameters that get in pretreatment. In order to prove the effectiveness of the new model, the calculation with data mining SVM algorithm is compared with that of single SVM and back propagation network. It can be seen that the new DSVM algorithm effectively improves the forecast accuracy by 0.75%, 1.10% and 1.73% compared with SVM for two random dimensions of 11-dimension, 14-dimension and BP network, respectively. This indicates that the DSVM gains perfect improvement effect in the short-term power load forecasting.  相似文献   

15.
与布尔型数据的频繁模式挖掘相比,时间序列的频繁模式挖掘是一个相对复杂的问题,目前对此类问题还缺少深入的研究.通过对小波滤波的研究,提出了一种时间序列的频繁模式挖掘算法,Frequent-Wavelet算法.该算法的特点是采用多孔平滑滤波器组对时间序列做低通平滑处理,用得到的多个尺度序列表示原序列,较好地解决了时间序列的平凡相似问题和时间轴伸缩问题.实验表明,Frequent-Wavelet算法对于时间序列的频繁模式挖掘具有较好的效果.  相似文献   

16.
利用数据挖掘技术分析处理石油斜井抽油生产过程中产生的海量数据,可得到很多有用的价值和信息。线性回归算法是预测技术中的重要内容,通过线性回归算法可对斜井抽油中的数据进行分析、处理,达到预测井眼轨迹等重要应用。  相似文献   

17.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

18.
我国刑法第一百四十条规定了“生产、销售伪劣商品罪”,从犯罪客观方面的行为阶段进行考察,由于“生产”、“销售”行为在法条中的并立,理论上一般认为“生产、销售伪劣商品罪”罪名属于选择性罪名,但笔者认为,单纯的生产伪劣产品的行为不宜定性为生产伪劣产品罪或生产、销售伪劣产品罪,也不能用刑法第一百四十条处理。同时,由于立法对“销售”的明文要求,笔者并不认同所谓的生产、销售伪劣产品罪(未遂)。  相似文献   

19.
企业在商业运营中积聚了大量的数据,如何从大量的数据中找出有价值的信息,帮助企业分析产品市场走向并提供更好的商务决策是目前数据挖掘领域研究的热点.以Apriori算法为主,介绍了基于模式与规则寻找的数据挖掘技术中的模式与规则寻找方法、关联模式评估方法等,为企业数据挖掘系统的研究与设计提供有益的帮助.  相似文献   

20.
一种时间序列相似性的快速搜索算法   总被引:5,自引:0,他引:5  
时间序列数据库中相似子序列的搜索,常用滑动窗口、分形插值逼近等方法将时间序列分割成各子序列,线性拟合各分段子序列,计算查询序列与各子序列的欧氏距离,满足距离阈值条件的为相似子序列.这些方法忽略了时间序列本身的位置和连贯特性.为此提出时间序列变化关键点的概念,以检索出的关键点为边界分割时间序列,线性拟合各分割的子序列,计算查询序列和各子序列的形态距离,快速搜索出相似子序列.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号