首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
序列分段问题是指将序列进行分段,用这些分段来代表一个序列,使原始序列在视觉角度基本不发生变化。本文首先介绍了三类经典的分段算法,比较它们的优劣,并针对其特点提出了一种改进的基于聚类的滑动窗口分段算法,并将其与经典算法作了一些比较,从而验证了新算法比经典算法有更好的拟合度和收敛性。  相似文献   

2.
韩陈寿  夏士雄  张磊  朱长成 《计算机工程》2011,37(7):219-221,236
目前的轨迹数据聚类直接对整条轨迹数据聚类,或先分段再对轨迹段聚类。分段聚类法抛弃轨迹段内部点,丢失轨迹局部特征,没有考虑点的速度影响。针对该问题,提出一种基于速度约束的分段轨迹数据聚类方法。该方法将速度约束和two-pass corner detection应用于轨迹分段,在邻域计算中加入速度约束,采用Discrete Fréchet Distance比较轨迹段距离,保留了轨迹段内部特征。用类似DBSCAN的TraDBSCAN算法对轨迹段进行聚类。实验结果表明,该方法考虑速度因素,可以获得更有效的聚类结果。  相似文献   

3.
提出一种新的聚类算法,分析待考察属性间的灰关联度,将其转化为属性权值,用于连通分支聚类的距离量度。该算法被用于处理铝电解工业生产中的分类问题。实验结果证明,它在一定程度上克服了欧氏距离的缺陷,能反映属性间的相互影响,提高聚类质量和性能。  相似文献   

4.
改进的基于距离的关联规则聚类   总被引:2,自引:1,他引:1  
关联规则挖掘会产生大量的规则,为了从这些规则中识别出有用的信息,需要对规则进行有效的分类组织.现有的规则聚类方法往往直接计算规则间的距离,忽略了项与项之间的联系,不能精确得出规则间的距离.提出一种改进的规则间距离的度量方法,首先计算项间的距离,其次计算相集间的距离和规则间的距离,最后基于此距离利用DBSCAN算法对关联规则进行聚类.实验结果表明,此方法是有效可行的,并能准确发现孤立规则.  相似文献   

5.
针对传统K-均值聚类算法初始聚类中心和聚类数目确定困难的问题,提出了基于密度统计法和最大距离乘积法的聚类中心选取方法.该方法通过对样本空间网格化,选出局部包含样本最多的网格,并对这些局部最优网格内的样本点进行ε邻域密度统计,然后取邻域密度最大且相距最远的两个样本点为聚类中心进行一次聚类.计算每个样本点到各个聚类中心的距离的积,取距离积最大的样本点为下一个聚类中心,并以此循环聚类.仿真实验表明,该方法在聚类精度上具有明显优势.  相似文献   

6.
在分析数据预处理的意义基础上,提出了一种基于最大距离算法的模式聚类的数据预处理方法。该方法不依赖于任何数学模型,通过对某造纸厂大量数据的仿真处理,研究表明本文提出的方法能在保留原始数据的有用信息的基础上剔除冗余数据,侦破过失误差,减少随机误差。  相似文献   

7.
利用现有的轨迹数据进行城市规划已逐渐成为一个值得研究的课题.针对电信公司提供的数据,提出了将轨迹分段聚类的算法.该算法首先将轨迹划分为一系列轨迹段,然后将相似的轨迹段聚到一个类中.在分段这部分使用最小描述长度(MDL)原则,在聚类阶段采用高斯混合模型(GMM).证明了该算法利用上海电信数据可以很好地聚类,直观地展示出行人的活动方式对城市规划起到重要意义.  相似文献   

8.
对视频点播系统中用户行为进行建模和仿真,是研究系统使用状况、设计性能优化算法的重要手段.但在以往的研究中,对用户行为建模和仿真都是基于整体历史数据的统计进行的,而在很多情况下,对不同模式的行为采用不同的策略能够更好的提供视频传输服务.本文针对视频点播系统中用户点播行为的特性,以及系统优化策略的需要,提出用户行为时间序列模型和聚类方法,在中国科技大学视频点播系统实际数据基础上进行了仿真测试,结果表明了该方法的可行性.  相似文献   

9.
覃俊  肖荣 《计算机应用》2012,32(4):1086-1089
对搜索引擎用户行为进行聚类分析有利于为用户提供个性化的服务。为了能准确地刻画用户行为的动态性,提出利用马尔可夫混合模型,对电子商务搜索引擎的用户行为模式聚类。模型假设每一类用户行为可表示为一个马尔可夫模型,当用户使用搜索引擎时,每个用户以一定的概率属于某一聚类;该用户的行为序列,由对应的马尔可夫模型产生。同时,为了解决参数估计和模型自动选择的问题,将贝叶斯阴阳和谐学习理论应用于该混合模型,提出针对该模型的和谐度函数及自适应梯度算法。仿真实验结果表明,与传统的最大期望(EM)算法相比,基于贝叶斯阴阳机的自适应梯度算法能更高效和准确地同时进行参数学习和模型选择。最后,将所提出的聚类方法应用于真实的电子商务搜索引擎点击日志,初步验证了本模型的有效性。  相似文献   

10.
基于聚类和关联规则的挖掘算法   总被引:4,自引:0,他引:4       下载免费PDF全文
数据挖掘技术中关联规则可以很好地发现数据项之间存在的相互关系,同时有大量的挖掘算法可供选择。聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。本文研究 聚类和关联规则的挖掘算法。  相似文献   

11.
针对快速K-me doids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小距离法,优化K-medoids算法初始聚类中心的选取,选择处于样本分布密集区域且相距较远的K个样本作为初始聚类中心;使用所有样本的相似度均值作为其构造去模糊相似矩阵的阈值。人工模拟数据集和UCI机器学习数据库数据集的实验测试表明,新K-medoids聚类算法具有更稳定的聚类效果,其准确率和Adjusted Rand Index等聚类结果评价指标值优于传统K-medoids聚类算法、快速K-medoids聚类算法和基于粒计算的K-medoids聚类算法。  相似文献   

12.
由于社交网络中人物与内容之间错综复杂的关系,如何合理地给用户推荐感兴趣的内容具有十分重要的意义。提出CCVR(Core user for Clustering interesting Vector for Recommend)算法。基于用户的兴趣矩阵,运用改进的K-means算法进行聚类从而推导类兴趣向量,由此预测用户对哪些内容标签感兴趣,从而形成推荐。实验结果证明CCVR算法具有良好的准确性。  相似文献   

13.
本文提出了一种新的聚类分段算法,这个算法以段内平均离散度最小、段间平均离散度最大为准则,采用聚类的方法逐次迭代选择最佳分段断点和分段段数,能正确地对汉语语音进行音素分段,它和以往分段方法相比在性能上有很大提高.文中还给出了应用该算法对汉语单音所作的部分实验统计结果,可供进一步开展基于音素或音位的汉语语音识别研究参考.  相似文献   

14.
首先对网络服务器监测到的流数据进行采集,提出将双层结构聚类算法应用于流数据的聚类分析,进而得到校园网用户网络行为的特征,该特征对于进一步优化校园网络建设具有重要意义。  相似文献   

15.
BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。  相似文献   

16.
罗兰  曾斌 《计算机工程》2010,36(19):110-112
针对目前周期关联规则难以划分时间区域和基础算法效率低等问题,提出一种基于周期关联规则的发现算法(CARDSATSV)。采用由项目支持度组成的时序向量作为时域数据特征点进行聚类,用DB Index准则控制聚类个数以达到最佳的聚类效果。给出CFP-tree算法来发现周期关联规则,利用基于条件FP-tree 的周期性剪裁技术提高算法效率。实验表明,和目前周期关联规则发现算法相比,CARDSATSV可以发现更多有用的周期关联规则,时空效率有一定的提高。  相似文献   

17.
基于用户浏览行为聚类Web用户   总被引:3,自引:0,他引:3  
本文结合Web用户浏览行为的特点,提出了一种新的路径相似度的计算方法,在计算相似度时不仅把用户的浏览模式仅作为一种序列模式来考虑,还充分考虑了用户在网上浏览的时间因素.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后,使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader算法聚类Web用户的有效性.  相似文献   

18.
传统的基于欧氏距离和K-means聚类算法的空值估计算法容易因为欧氏距离对量纲的敏感性和初始聚类中心对K-means聚类效果的影响产生估值误差。将层次聚类算法和K-means聚类算法有机结合起来的H-K聚类算法克服了K-means算法对初始聚类中心的敏感性,从而改善了聚类效果。与欧氏距离不同,马氏距离可以避免量纲的影响。为此提出一种改进的空值估计算法,将H-K聚类应用到空值估计算法中进行聚类,在聚类时采用马氏距离代替欧氏距离,在聚类后使用多元线性回归法计算样本中的空值。实验结果表明改进后的空值估计算法使得估计值的绝对误差率(MAER)得到降低。  相似文献   

19.
针对SURF(Speeded Up Roubust Features)算法在检测特征点和进行特征匹配过程中存在的受噪声点干扰,容易产生误匹配、匹配效率低等问题,提出一种基于聚类和马氏距离的改进SURF图像匹配算法。首先,利用均值聚类算法剔除噪声,对SURF算法提取的特征点,采用聚类算法进行分类和噪声点去除,生成新的特征点数据集;然后,应用马氏距离考虑整体相关性的特点,将SURF算法中的欧式距离用马氏距离替代,提高算法的匹配效率。实验应用于昆虫图像识别和匹配时,改进算法较原SURF算法在匹配效率和准确率上有明显提高。  相似文献   

20.
现有方法没有有效利用查询文本特征、点击行为和session信息来挖掘用户的搜索意图,获取的查询特征对于多意图查询在不同意图下的区分度不足,对于多意图查询的相关查询聚类效果不佳。针对以上问题,该文提出了基于查询图信息的GPLSI模型,并利用该模型学习所得的查询特征进行查询聚类。基于查询图信息的GPLSI模型利用查询的词语、点击和session共现现象,从查询的文本特征、点击行为和session信息等多个方面来模拟查询意图的产生和表现,学习查询在不同搜索意图上的概率分布。最后,实验结果验证了基于查询图信息的PLSI模型用于查询相似度计算和多意图查询聚类中的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号