共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
根据Web日志挖掘的特点,介绍了Web数据挖掘的分类和过程.将关联规则应用到日志挖掘算法中,并利用云理论对关联规则算法进行优化,使之更能符合人的思维方式. 相似文献
3.
对Web日志中用户访问数据的挖掘可以很好的获得系统优化的信息,方便Web站点走向个性化、智能化道路。本文深入了解了Web日志格式的内容,研究了进行Web日志挖掘的一般流程。采取预处理的方式来获得用户有用信息,经过数据清理、用户识别、用户会话识别、界面过滤、路径补充来完成信息的有效汲取,最终通过模式发现和模式分析来完成对使用者感兴趣信息的传送工作,将Web日志挖掘技术真正应用在站点优化进程中。 相似文献
4.
孪生支持向量机通过求解较小的二次规划问题,提高了分类器的性能,然而,该方法主要利用了类间可分的特性,并使用hinge损失函数构建相应的模型,它们并未充分考虑不同类中数据的结构信息以及不同样本对分类的影响,导致该方法对噪声具有较强的敏感性以及重取样的不稳定性.为了进一步提高孪生支持向量机的性能,基于pinball损失函数,将数据集中不同类的结构信息以及不同样本的作用引入到孪生支持向量机中,获得了基于pinball损失的结构模糊孪生支持向量机模型,从理论上导出了基于pinball损失的结构模糊孪生支持向量机算法pin-sftsvm,通过选取人工生成数据集与UCI标准数据集,对pin-sftsvm算法进行了实验,并与tbsvm、s-tsvm和pin-tsvm算法进行了性能比较,表明了提出算法的有效性. 相似文献
5.
6.
支持向量机(Support Vector Machines,SVM)理论在变压器故障诊断中得到了越来越多的应用,由于变压器故障数据有限,在参数的优化选择方面还存在理论支持问题。为及时监测矿用变压器潜伏性故障和提高故障诊断效率,根据支持向量机原理,采用变压器故障时产生的氢气、甲烷、乙烷、乙烯、乙炔的浓度数据,本文提出了支持向量机的参数和参数的交叉验证算法,寻找最佳的参数和参数,利用优化后的参数对训练集进行训练,最终得到最佳的支持向量机模型,并对测试集进行分类,从而诊断出矿用变压器的故障类型。实例研究结果表明,该方法可行,具有较高的故障诊断准确率。 相似文献
7.
针对支持向量机(svM)模型不能有效处理海量数据挖掘的问题,提出一种改进的基于主动学习的支持向量机(AL_SVM)方法。该方法首先将训练集随机划分为多个独立同分布的子集,并选择其中一个子集作为初始训练集来训练SVM得到初始分类器和支持向量集,然后根据已经得到的分类器信息在剩余样本集中选择对于分类器改进作用最大的有价值样本。并与已得到的支持向量集合并构成新训练集,以更新分类器,从而在保留重要支持向量信息的前提下,去除大量不重要的支持向量,一定程度上避免了过学习问题,提高了学习效率。实验表明,AL_SVM方法能够在保持学习器泛化能力的同时提高其学习效率。 相似文献
8.
文中基于大数据技术,研究了基于支持向量机的网络流量分析与异常检测方法。首先,对网络流量数据进行预处理,如清洗、集成和转换等,以获取适合支持向量机分析的特征向量表示。然后,应用支持向量机分析技术对网络流量进行异常检测,通过构建超平面实现对正常样本和异常样本的分类。最后,利用NSL-KDD数据集进行实验验证,并评估该方法在网络流量异常检测中的性能。实验结果表明,基于支持向量机的网络流量异常检测方法在NSL-KDD数据集上取得了较好的准确率、召回率和精确率。 相似文献
9.
10.
一种基于日志的攻击模式挖掘方法 总被引:1,自引:0,他引:1
建立"择优"和"劣汰"过程结合的攻击模式挖掘模型对日志信息进行分析."择优"过程运用改进正交化算法的稀疏化策略对数据集进行重新组合,提高了最小二乘支持向量机分类模型的效率."劣汰"过程提出了基于相关度检测法的改进滑动窗策略,剔除了虚假攻击事件,避免重复的攻击模式在"择优"过程的结果集中反复出现.实验证明,该方法能够高效准确地挖掘出网络中存在的复杂的攻击模式,实时对网络安全进行监控. 相似文献
11.
由于网络信息量巨大,为了快速找到所需信息,需要采用数据挖掘技术。在众多数据挖掘技术中,关联规则挖掘方法应用十分广泛。所以,在多媒体图像挖掘中应用关联规则十分重要。本文对图像挖掘和关联规则进行了简单介绍,并详细阐述了多媒体图像挖掘中的关联规则挖掘。 相似文献
12.
由于网络信息量巨大,为了快速找到所需信息,需要采用数据挖掘技术。在众多数据挖掘技术中,关联规则挖掘方法应用十分广泛。所以,在多媒体图像挖掘中应用关联规则十分重要。本文对图像挖掘和关联规则进行了简单介绍,并详细阐述了多媒体图像挖掘中的关联规则挖掘。 相似文献
13.
Web数据挖掘技术研究 总被引:5,自引:0,他引:5
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。 相似文献
14.
工作面回采是矿山开采中一项极其重要的工作,回采对相关采空区、回采巷道的影响极为重大,掌握好回采对其的影响规律,对整个矿山活动具有重大意义。本文分别从回采对采空区顶板岩性对巷道的影响、开采后采煤工作面顶板活动规律和采煤工作面对采区巷道的影响方面进行了阐述,并提出了一般采区巷道布置受采动影响规律及预防措施,在实践中得到了很好的应用效果。 相似文献
15.
16.
通过分析了目前网络课程应用中存在的问题,提出基于web挖掘的网络课程平台设计模型,并重点对Web挖掘系统模块关键技术进行介绍。论文对增强网络课程应用的实用性、可评价性有较大作用。 相似文献
17.
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存利用率的极大浪费,尤其是在支持度较低的情况下。Diffsets算法通过引入"差集"的概念,在一定程度上解决了挖掘过程中产生的大量中间结果与内存容量之间的矛盾。改进型Diffsets算法是在原算法的基础上,在差集运算过程中根据差集中所包含的事务标识个数进行递减排序,进一步减少了挖掘过程中产生的中间结果数量。分析与实例表明,改进后的算法在执行过程中将占用更少的内存空间,加快了算法的收敛速度。 相似文献
18.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域. 相似文献
19.
20.
Unil Yun 《ETRI Journal》2007,29(3):336-352
Sequential pattern mining has become an essential task with broad applications. Most sequential pattern mining algorithms use a minimum support threshold to prune the combinatorial search space. This strategy provides basic pruning; however, it cannot mine correlated sequential patterns with similar support and/or weight levels. If the minimum support is low, many spurious patterns having items with different support levels are found; if the minimum support is high, meaningful sequential patterns with low support levels may be missed. We present a new algorithm, weighted interesting sequential (WIS) pattern mining based on a pattern growth method in which new measures, sequential s‐confidence and w‐confidence, are suggested. Using these measures, weighted interesting sequential patterns with similar levels of support and/or weight are mined. The WIS algorithm gives a balance between the measures of support and weight, and considers correlation between items within sequential patterns. A performance analysis shows that WIS is efficient and scalable in weighted sequential pattern mining. 相似文献