共查询到20条相似文献,搜索用时 281 毫秒
1.
赵北庚 《电脑编程技巧与维护》2015,(2):54-56
Apriori算法是一种挖掘关联规则的频繁项集算法,广泛应用于商业领域与网络安全领域.描述了使用R语言arules扩展包的Apriori算法对真实的商品交易数据进行关联规则挖掘的过程,并对挖掘结果进行分析.对商品交易数据的关联规则挖掘思路可借鉴应用于其他情景的关联规则挖掘. 相似文献
2.
关联分析是一种重要的数据挖掘技术。本文结合房地产行业的特点,将关联分析方法应用于对消费者购房行为的研究中。传统的关联规则挖掘算法——Apriori算法在实际应用中存在着计算量大、挖掘效率低、产生大量不相关的关联规则等问题。为了减少计算量、提高挖掘效率、发现有价值的关联规则,提出了一种灰色关联度分析算法和Apriori算法结合的研究方法。首先采用灰色关联度分析算法得出影响消费者购房需求和偏好的关键因子,然后采用Apriori算法对关键因子和目标因子之间进行关联规则挖掘。以某市问卷调查的消费者信息记录进行建模,结果表明该关联分析方法具有较高的挖掘效率并且研究结果具有合理性和准确性。 相似文献
3.
4.
关联分析是一种重要的数据挖掘技术。文中结合房地产行业的特点,将关联分析方法应用于对消费者购房行为的研究中。传统的关联规则挖掘算法-Apriori算法在实际应用中存在着计算量大、挖掘效率低、产生大量不相关的关联规则等问题。为了减少计算量、提高挖掘效率、发现有价值的关联规则,提出了一种灰色关联度分析算法和Apriori算法结合的研究方法。首先采用灰色关联度分析算法得出影响消费者购房需求和偏好的关键因子,然后采用Apriori算法对关键因子和目标因子之间进行关联规则挖掘。以某市问卷调查的消费者信息记录进行建模,结果表明该关联分析方法具有较高的挖掘效率并且研究结果具有合理性和准确性。 相似文献
5.
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性。通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题。Apriori算法是关联规则挖掘中的经典算法。对Apriori算法做了改进。借助0—1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率。 相似文献
6.
在民航业务中,旅客订座后却不能如期登机(NOSHOW)一直是航空公司收益亏损的未解之题,为了解决该问题,提出了一种民航NOSHOW预测及强因子关联分析方法。首先利用优化C5.0算法进行NOSHOW决策树建模,得到了NOSHOW相关因子的量化结果,然后通过Apriori算法对NOSHOW强因子进行关联规则挖掘。实验构建了准确率为99.75%的NOSHOW决策树模型,得到了139条置信度在80.054%以上、支持度在10.021%以上的因子关联规则,进一步揭示了NOSHOW强因子之间的隐含关联关系,为各大航空公司实现准确的NOSHOW预测及收益提升管理提供了有效的决策依据。 相似文献
7.
Apriori关联规则数据挖掘算法只针对一类相关数据集进行数据挖掘,而现实世界中各种不同的数据集非常庞大,如何在不相关数据集间进行数据挖掘,拓展规则的数量具有挑战性。目前Apriori关联规则算法研究基本上集中在算法性能优化和针对不同数据形式的基础上,没有突破不相关数据集的界限。针对这个问题,首先给出了相关数据集、不相关数据集、相容数据集的概念,进一步给出了一种基于Apriori的不相关数据集中相容数据集间的关联规则演绎算法,给出了算法演绎规则,通过构建法证明了算法的正确性。通过实例演示了应用方法,该算法可实现基于Apriori的相容数据集间关联规则的规则演绎,是普通数据挖掘算法无法实现的,扩展了关联规则算法的应用领域;同时,由于关联规则是在相容数据集上独立挖掘出来的,没有进行原始数据间的交换,在一定程度上实现了隐私保护 相似文献
8.
通过对各届毕业生生源等特征资料、高考的成绩数据、以及大学各门课的成绩挖掘,提供了一个在教育领域进行合理挖掘的模式。研究了如何把关系数据库的关联规则问题转化为单维、布尔关联规则问题,把关联规则挖掘中的经典算法Apriori算法在实例中进行了具体应用。 相似文献
9.
DNS访问记录体现了网络用户的访问意图,通过Apriori关联规则挖掘算法处理这些记录,生成关联规则用以发现网络用户的访问行为模式,从而满足用户识别、用户分析等应用需求。该文详细分析了Apriori关联规则挖掘算法,针对其不足进行改进,应用于DNS访问记录挖掘中,对产生的关联规则进行了分析,得到相关用户的一些访问行为模式。 相似文献
10.
一种改进的Apriori算法 总被引:6,自引:2,他引:4
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apaod进行分析,发现该技术存在的问题.Apriori算法是关联规则挖掘中的经典算法.对Apriori算法做了改进.借助0-1矩阵给出了计算项集的支持度计数的更快方法,同时还简化了Apriori算法中的连接和剪枝操作,从而在时间和空间上提高了Apriori算法的效率. 相似文献
11.
12.
基于Web日志挖掘的个性化服务站点 总被引:2,自引:1,他引:2
介绍个性化站点的概念,并对Web日志挖掘系统体系结构进行分析。其后将关联规则挖掘技术应用到日志事务会话中,在对日志数据的特性分析的基础上提出类Apriori挖掘算法。对类Apriori挖掘算法得到的频繁项集如何有效提取关联规则提出了最有效的方法。在实际应用中探讨了如何从多个匹配的关联规则中选择合适的匹配规则。 相似文献
13.
运用模糊集挖掘数量属性数据的关联规则 总被引:3,自引:0,他引:3
绝大多数关联规则的挖掘方法基于布尔属性数据,但在现实应用中会经常需要对数量属性的数据进行关联挖掘。该文就提出一种算法,在经典Apriori后选集算法的基础上引入了模糊逻辑集合的概念,将数据集中的数量属性按照模糊集合定义进行划分从而将原始事务数据转化成基于模糊集的数据,然后再运用Apriori算法发现潜在的关联规则。 相似文献
14.
本文基于路面评价指标中车辙深度指数和行驶质量指数来评价路面的损坏情况,使用关联规则挖掘环境、交通、路面等影响因素与路面状况之间的关联程度.针对关联规则Apriori算法复杂度和耗时的缺点,提出一种不生成候选集的方法来产生频繁集的改进Apriori算法,并通过实验对比证明改进的Apriori算法能够有效提升速度和性能.使用改进的Apriori算法分析路面评价指标及其影响因素之间的强关联规则,得到不同环境路面损坏的主要成因.本文结论能够对路面养护提供科学可靠的支持,可为路面养护部门提供合理的养护建议与数据支撑. 相似文献
15.
基于无线网络关联回溯问题的研究,提出了一种基于Apriori算法的无线网络关联回溯系统。首先,对系统的整体框架进行设计;然后根据系统需要满足的要求,分别对系统中的数据采集、协议识别、恶意流量检测、界面可视化呈现以及关联回溯5个关键功能模块进行了研究与设计,并对关联回溯模块中的Apriori关联规则挖掘算法进行了改进;最后分别对算法与系统的性能与可行性进行实验测试。实验结果表明:改进后Apriori算法的性能更佳、平稳性更好,更适用于数据库庞大的无线网络安全事件信息关联规则挖掘。基于Apriori算法的无线网络关联回溯系统对无线网络攻击事件的检测率都在80%以上,表明系统能够为关联回溯模块提供较为准确与丰富的数据;系统能够通过关联回溯获取强关联规则并进行保存;且运行稳定,总体性能较高。 相似文献
16.
基于关联规则挖掘领域的Apriori算法的优化研究 总被引:2,自引:0,他引:2
挖掘关联规则是数据挖掘领域的一个重要研究课题,在挖掘数据间的关联性时具有非常重要的意义。本文在分析关联规则挖掘及Apriori算法的基础上,从压缩扫描数据集及提高剪枝效率等方面对算法进行了优化改进,从而达到了降低消耗、提高算法效率的目的。最后,通过实例对优化的Apriori算法作了详细介绍。 相似文献
17.
18.
本文提出一种基于粗糙集理论和Apriori算法的关联规则挖掘方法并将其应用于中医病证关联分析。该方法通过属性约简抽取特征症状,然后在约简后的决策表上应用改进的Apriori算法进行关联规则挖掘,提高了中医病证关联规则挖掘的效率。 相似文献
19.
张婷 《自动化与仪器仪表》2023,(7):5-9
针对图书馆服务自动化感知效果不佳,导致无法实现学生个性化推荐的问题,提出将最近邻搜索K-means聚类算法与关联规则算法相结合,构建一个基于大数据挖掘技术的图书馆服务自动化感知模型。首先,基于读者借阅行为,采用最近邻搜索K-means聚类算法(NNSK-means)分别从个体层次和集体层次进行聚类分析,挖掘出读者的阅读趋势和阅读兴趣;然后通过基于Apriori关联规则算法进行图书间与院系间关联规则挖掘;最后基于挖掘结果进行读者借阅不同种类图书概率反映和分析,从而提升自动化感知和个性化推荐效果。结果表明,采用提出的基于大数据挖掘技术的图书馆服务自动化感知模型后,热门图书推荐服务与学生个性化推荐服务的准确率和学生满意度分别保持在98%和90%以上,表明构建的模型可实现图书馆服务自动化感知,模型性能良好,可为学生提供更加精准的个性化推荐服务。 相似文献
20.
通过分析Apriori算法的特点,提出一种有针对性的联机分析处理(OLAP)关联规则挖掘模型。该模型在数据立方体维度和度量值设计上充分考虑了Apriori算法的特点,使数据立方体物化更多算法所需要的中间数据;同时适当改进算法使之适应所设计的数据立方体。研究表明,该设计方法在灵活性和效率方面都有较好的表现。 相似文献