排序方式: 共有20条查询结果,搜索用时 15 毫秒
1.
提出一种基于TD-FP-growth的模糊关联规则挖掘算法.首先,使用3种t-模算子以及由其产生的蕴涵算子计算模糊频繁项的支持度和规则的蕴涵度,产生的关联规则能表示模糊项间的确定性和渐近性逻辑语义;然后,以事务的惟一标识为键值,散列存储每个事务相对FP-tree中每个结点所表示模糊项的隶属度,使TD-FP-growth适用于模糊频繁项的挖掘,并分析了算法的时间和空间复杂度;最后,实验结果表明该算法比基于apriori的模糊频繁项挖掘算法在时间方面更加有效. 相似文献
2.
为解决传统关系数据库存储QAR数据可扩展性低、可用性差的问题,设计一种基于HBase的QAR数据分布式存储方法。根据QAR数据的特点,设计HBase表结构,将QAR参数划分为安全、航迹、燃油、发动机、预测、飞行员操作及其它共七大主题,构建基于航班号、航班日期、参数主题三者组合的MD5散列值行键结构,根据行键散列值对QAR数据值表预分区,通过行键散列机制和预分区技术相结合的两级优化策略实现QAR数据文件分布式存储。真实QAR数据集上的实验结果表明,该QAR数据存储模式能使数据均衡分布在集群中,避免了写热点和数据倾斜问题,有较高的存取性能。 相似文献
3.
为了提高动态数据集上模糊关联分类器(FAC)的建模效率,提出了一种基于演进向量量化(eVQ)聚类的增量模糊关联分类方法。首先,采用eVQ聚类算法增量更新数量属性上的高斯隶属度函数参数;然后,扩展早剪枝更新(UWEP)算法,使之适用于增量挖掘模糊频繁项;最后,以模糊相关度(FCORR)和分类规则前件长度为度量方式裁剪并更新模糊关联分类规则库。在4个UCI标准数据集上的实验结果表明,与批量模糊关联分类建模方法相比,所提方法能够在保证分类精度和解释性的前提下,减少模糊关联分类器的训练时间;基于eVQ的高斯隶属度函数的增量更新有助于提高动态数据集上模糊关联分类器的分类精度。 相似文献
4.
针对已有基于模型的多维时间序列(MTS)聚类算法处理不等长MTS速度较慢的问题,提出了一种基于LR分量提取的MTS聚类算法(MUTSCA〈LRCE〉)。首先,采用等频离散化方法符号化MTS;然后,计算用于表达MTS样本各维时间序列之间时序模式的LR向量,对每个LR向量进行排序后从其两端提取固定数目的不同关键分量,所有提取的关键分量拼接形成表示MTS样本的模型向量,该过程将不等长MTS样本集转换为等长的模型向量集;最后,采用k-means算法对生成的等长模型向量集进行聚类分析。在多个公共数据集上的实验结果表明,与基于模型的MTS聚类算法——MUTSCA〈LR〉相比,所提算法能够在保证聚类效果的前提下,显著提高不等长MTS数据集的聚类速度。 相似文献
5.
提出了基于分布估计算法的模糊分类建模方法,该方法基于Apriori原理生成初始模糊规则集,并且以匹茨堡型的二进制编码方式对模糊规则集编码,基于双变量相关的MIMIC (mutual information maximization for input clustering)分布估计算法从初始规则集中自动抽取模糊规则.通过在Iris,Pima,Wine这3个标准数据集的仿真实验表明,该方法比基于遗传算法的模糊分类器在准确率和解释性方面更有效. 相似文献
6.
设计并实现了一种基于SQLServer的演绎规则处理器,其主要功能是把演绎规则转换为含有SQL语句的过程代码,利用该处理器用户可用一阶逻辑谓词定义和查询IDB关系。 相似文献
7.
提出一种基于TD-FP-growth的模糊关联规则挖掘算法.首先,使用3种t-模算子以及由其产生的蕴涵算子计算模糊频繁项的支持度和规则的蕴涵度,产生的关联规则能表示模糊项间的确定性和渐近性逻辑语义;然后,以事务的惟一标识为键值,散列存储每个事务相对FP-tree中每个结点所表示模糊项的隶属度,使TD-FP-growth适用于模糊频繁项的挖掘,并分析了算法的时间和空间复杂度;最后,实验结果表明该算法比基于apriori的模糊频繁项挖掘算法在时间方面更加有效.
相似文献8.
基于自编码器和隐马尔可夫模型的时间序列异常检测方法 总被引:1,自引:0,他引:1
针对已有基于隐马尔可夫模型(HMM)的时间序列异常检测模型的符号化方法不能很好地表征原始时间序列的问题,提出了一种基于自编码器和HMM的时间序列异常检测方法(AHMM-AD)。首先,通过滑动窗口对时间序列样本进行分段,按照分段位置形成若干时间序列分段样本集,由正常时间序列上不同位置的分段样本集训练各个分段的自编码器;然后,利用自编码器得到每个分段时间序列样本的低维特征表示,通过对低维特征表示向量集的K-means聚类处理,实现时间序列样本集的符号化;最后,由正常时间序列的符号序列集生成HMM,根据待测样本在已建HMM上的输出概率值进行异常检测。在多个公共基准数据集上的实验结果显示,AHMM-AD比已有的基于HMM的时间序列异常检测模型在精确度、召回率和F1值分别平均提高了0.172、0.477、0.313,比基于autoencoder的时间序列异常检测模型,在这三方面分别平均提高了0.108、0.450、0.319。实验结果表明,AHMM-AD方法能够提取时间序列中的非线性特征,解决已有HMM建模时间序列符号化过程中不能很好表征时间序列的问题,并在时间序列异常检测性能上也有显著提升。 相似文献
9.
针对长短时记忆网络自编码器(LSTM-AE)在多维时间序列(MTS)上异常检测效率低的问题,提出一种基于集成LSTM-AE(LAE)的MTS异常检测模型。该模型集成多个LSTM-AE分别重构正常MTS各子序列,并将各重构误差作为MTS的局部特征;利用全连接网络自编码器(FCAE)对各重构误差数据进行拟合,学习MTS数据的全局特征;根据FCAE的重构误差进行异常检测。在三个公共MTS数据集上的实验表明,与基准方法相比,在Precision、Recall和F1_score三个评价指标下分别最大提升0.058 4、0.118 4和0.078 6。 相似文献
10.
无监督深度学习网络的训练目标从信息论的角度可解释为最大化训练样本及其表示之间的互信息.对抗自编码器(AAE)通过生成对抗的方式学习训练样本集的分布,据此可以由AAE建立基于正常样本集的半监督异常检测模型,但是AAE无法显式最大化正常样本及其表示间的互信息.为此,提出了一种互信息估计网络和AAE相融合(IAAE)的异常检测方法,该方法首先以重构误差最小化为目标,训练编码器和解码器;其次,在对抗正则化阶段将正常样本低维表示的聚集后验分布约束为先验分布,并最大化正常样本与其表示之间的互信息;最后由全连接神经网络估计正常样本与其表示之间的互信息.由待测样本的重构误差及其表示在隐空间中的众数散度计算其异常得分值.公开数据集上的实验结果表明,与已有典型相关的深度异常检测模型相比,IAAE模型在F1取值上具有更好的表现. 相似文献