首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
Web日志挖掘中模糊C均值聚类研究   总被引:1,自引:0,他引:1  
Web日志挖掘就是通过一定的方法分析Web日志数据,发现用户的访问习惯,帮助管理人员改进Web站点的性能和结构,提高用户获取知识的质量和速度。笔者首先在Web日志挖掘的背景下分析了模糊C均值聚类算法的缺陷,针对其的不足,在粗糙集理论的支持下,介绍属性信息量的概念,并通过计算待聚类对象的属性权值,区分重要性属性和噪音属性对聚类结果的影响,实验证明该方法提高了模糊C均值聚类算法的准确率。  相似文献   

2.
在Web日志挖掘中应用聚类改进网站结构的研究   总被引:2,自引:0,他引:2  
介绍了Web日志挖掘的概念,通过聚类技术在Web日志中实现挖掘出访问网站的相似爱好的用户群体、页面之间的内在联系,以此改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

3.
因Web的高度普及,Web所包含的信息越来越丰富。因用户的不同能够从Web搜索不同的信息。借助Web日志挖掘,利用聚类技术能够合理实施聚类,可完善网站、提升服务水平,促进网络营销。笔者将结合现有经验,重点探讨Web日志挖掘问题。  相似文献   

4.
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法.构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法...  相似文献   

5.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

6.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

7.
网站个性化服务的研究   总被引:6,自引:0,他引:6  
利用Web数据挖掘技术,对用户未来的访问进行预测和推荐,是实现网站柔性个性化服务的研究方向之一.笔者通过对网站个性化服务相关技术的研究,改进了对Web服务器用户访问日志信息进行聚类分析的关联数据竞争聚类(competitive agglomeration for relation data,CARD)算法,并在此基础上构建了相应的实验模型.CARD算法是CA算法的一种改进算法,适合于处理没有明显特征的Web数据.试验是建立在真实的Web日志上的,实验证明该算法具有较好的聚类效果和适用度.  相似文献   

8.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

9.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣。这种兴趣程度可以通过用户对Web站点上页面的浏览顺序表现出来。Web站点的访问日志记录了用户访问页面的详细信息。在对Web站点的访问日志进行事务识别后,按照访问兴趣对群体用户对Web站点的访问顺序进行聚类分析,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。文中在用户访问兴趣度量中综合考虑用户访问路径、网页内容、在此页面的驻留时间、此页面浏览频度因素,提出了一种基于用户访问兴趣的路径聚类算法。最后通过实验来验证这种算法的有效性。  相似文献   

10.
基于Web日志挖掘的智能站点体系   总被引:4,自引:0,他引:4  
Web日志挖掘是通过分析Web服务器的日志文件,以发现用户访问站点的浏览模式,为站点管理员提供各种利于Web站点改进或可以带来经济效益的信息。在分析了Web日志挖掘主要特点之后,提出了一个可行的面向Web日志挖掘的智能站点结构,并给出了一个架构于Apache服务器上的智能站点原型。  相似文献   

11.
针对数字音频信号分类问题提出了基于二型模糊集合理论的C均值聚类算法,并在此基础上应用跳跃基因遗传算法对聚类得到的初始模糊模型进行优化,最后采用向量相似性测度准则对优化后的模糊规则集合进行简化,得到最终的模糊分类器模型。与传统的一型模糊集合相比,二型模糊集合可以掌控更多的不确定性信息。基于二型模糊集合理论的C均值聚类算法对样本分布不均匀、结构不规则的样本集的聚类效果更精确。实例仿真结果对比显示,应用二型模糊C均值聚类算法的音频信号分类器比应用一型模糊C均值聚类算法的分类器得到的分类结果更准确。  相似文献   

12.
抑制式模糊C-均值聚类研究综述   总被引:1,自引:0,他引:1  
模糊C-均值聚类及其各种变形和推广在实际应用中取得了巨大成就,获得了国际学者的广泛认可。目前,国际上形成了以硬C-均值聚类、模糊C-均值聚类、可能性C-均值聚类为基础的三大聚类算法簇。抑制式模糊C-均值聚类算法架起了连接硬C-均值聚类算法和模糊C-均值聚类算法的一个桥梁,本文就抑制式模糊C-均值聚类的研究现状进行综述,以期对该算法的更深入研究和应用起到推动作用。  相似文献   

13.
基于核方法的模糊聚类算法   总被引:31,自引:0,他引:31  
将核方法的思想推广到模糊C-均值算法,构造了基于核函数的模糊核C-均值算法,使其能够聚类非超球体数据、被噪声污染数据、多种模式原型混合数据、不对称数据等多种数据结构,并指出一阶多项式模糊核C-均值算法等价于模糊C-均值算法.人工和实际数据的实验结果表明,与模糊C-均值算法相比,模糊核C-均值算法在多种数据结构条件下可以有效地进行聚类.  相似文献   

14.
Considering neutrosophic C-means clustering algorithm with weak ability of suppressing noise, a neutrosophic C-means clustering segmentation algorithm based on the hidden Markov random field is proposed. First, the hidden Markov random field is used to describe the prior information of the arbitrary pixels classification. Second, information divergence between the prior information and sample classification membership is taken as a regular term and embedded into the existing neutrosophic C-means clustering objective function. Third, the samples in the European Space is mapped into the high-dimensional space through the kernel function, and the iterative expression for the neutrosophic C-means clustering segmentation algorithm based on the hidden Markov random field is obtained by the optimization method. Many standard, actual, and synthetic images corrupted by noise are used to validate the segmentation performance of the improved clustering segmentation algorithm. Experimental results show that the anti-noise performance of the proposed segmentation algorithm is improved significantly than the fuzzy C-means clustering algorithm based on the hidden Markov random field, and other fuzzy clustering segmentation algorithms.  相似文献   

15.
本文介绍了模糊C均值聚类算法,诱导的模糊C分划算法,基于非对称不相似性的系统聚类算法以及模糊集的峰值搜索算法,给出了关于几个实验数据集的聚类结果,并讨论了这些算法的性质。结果表明,系统聚类算法在这四种算法中最有效,而峰值搜索法优于模糊C均值和诱导的模糊C分划算法。  相似文献   

16.
为了解决传统模糊C均值算法(FCM)依赖初值、易于陷入局部极值的问题,设计实现了一种遗传模糊C均值聚类算法(GFCM),该算法以模糊聚类中心矩阵为优化变量,将FCM算子引入遗传算法中以增强遗传算法的寻优能力,对聚类中心施加进化扰动以寻找最优聚类;描述了FCM和GFCM的基本流程,通过一个织物性能聚类评价例子对比了两种方法的性能,证明了GFCM的优越性.  相似文献   

17.
基于蚁群算法的模糊C均值聚类医学图像分割   总被引:1,自引:0,他引:1  
在医学图像分割研究中,针对模糊C均值(FCM)聚类算法聚类个数难于确定、搜索过程容易陷入局部最优的缺陷,把蚁群算法与FCM聚类算法有机结合,提出了一种基于蚁群算法的模糊C均值聚类图像分割算法. 该算法首先利用蚁群算法全局性和鲁棒性的优点,得到聚类中心和聚类个数,再将其作为模糊C均值聚类的初始聚类中心和聚类个数,弥补了传统FCM聚类算法的不足,得到了较好的分割效果. 实例分析证明了算法的有效性和实用性.  相似文献   

18.
分类识别是超谱遥感图像的重要研究领域.由于超谱图像空间分辨率低,像元混合的概率大,因此采用单纯的聚类或者监督分类都不能取得好的效果.为了提高超谱图像分类的精度,提出了模糊最大似然分类算法.先用模糊C-均值法对图像进行聚类,再在聚类结果的基础上,参考真实地物图,选择训练样本,用最大似然法进行最终的分类.实验结果表明,提出的算法由于在聚类的基础上选择监督分类的样本,因而获得了关于图像的更准确的信息,最终分类结果比模糊C均值聚类高出34.38%,比最大似然分类高出10.46%.  相似文献   

19.
文章提出了将HCM,FCM和核方法结合在一起的,一种改进模糊核聚类算法。该算法的思想是将样本数据映射到特征空间,然后在特征空间内计算类中心、隶属度以及距离表达式,再在特征空间内进行模糊聚类,并且针对个别样本(即隶属度比较接近的样本)加入了截集因子确定样本的归属,确保聚类的效果。实验结果表明,与传统的模糊聚类算法相比,改进的模糊核聚类算法在多种数据结构条件下可以有效地进行聚类,总体性能优于HCM,FCM和FKCM。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号