首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 320 毫秒
1.
针对传统协同过滤推荐算法没有充分考虑用户属性及项目类别划分等因素对相似度计算产生的影响,存在数据稀疏性,从而导致推荐准确度不高的问题.提出一种基于用户属性聚类与项目划分的协同过滤推荐算法,算法对推荐准确度有重要影响的相似度计算进行了充分考虑.先对用户采用聚类算法以用户身份属性聚类,进而再对项目进行类别划分,在相似度计算中增加类别相似度,考虑共同评分用户数通过加权系数进行综合相似度计算,最后结合平均相似度,采用阈值法综合得出最近邻.实验结果表明,所提算法能够有效提高推荐精度,为用户提供更准确的推荐项目.  相似文献   

2.
准确合理的运营时段划分方案是制定地铁列车开行方案的前提和基础,也是提高地铁运营效率的重要方式.为了合理划分地铁运营时段,本文构建时段客流特征向量以划分地铁运营时段.以10 min为时间间隔对全日运营时段进行分段,并根据时段内的客流变化特点构建各时段的特征向量.并以此为基础采用K-means算法进行聚类,同时以肘部法则、轮廓系数等聚类评估指标对结果进行评价,以确定最优聚类数,进而得到最优的运营时段划分方案.最后以福州地铁一号线为例,给出了该路线的运营时段划分方案,验证了该方法的可行性.  相似文献   

3.
罗彪  闫维维  万亮 《计算机应用》2013,33(10):2954-2959
建立两维度的客户价值评价模型,从客户当前价值和潜在价值两个方面评价客户价值。该模型首先运用网络层次分析法(ANP)对指标赋权,兼顾了指标间的相互影响,根据各指标权重和得分计算客户价值;然后使用K-means聚类算法对客户群进行细分,确定客户等级划分的标准,划分客户类别。最后以某市烟草公司零售终端客户价值分类为应用实例,运用定性和定量的方法建立多角度的客户价值评价指标体系,采用ANP确定指标权重,并根据客户价值评价结果使用K-means聚类进行客户分类,同时对每个类别的客户特征及其相应的营销策略进行分析,所提模型能够更全面、客观地对客户价值进行评价与分类  相似文献   

4.
历史客运量与客运需求存在差距,基于余票查询数据的起讫点(OD)客流特征分析可以较为实时地反映客运需求。对于一些客流特征的挖掘目前主要的方法是利用聚类算法进行群体划分,进而发现每个类别的特征。针对余票查询数据维度高,直接使用聚类算法鲁棒性较差的问题,提出了一种基于随机距离预测的高层特征抽取模型RDP与K-means结合的OD客流聚类分析方法。以京沪高速铁路预售期内余票查询量数据为原始数据,将乘车日期作为预分类条件,运用RDP算法提取预分类后数据的重构特征,然后通过K-means算法对重构特征进行聚类。实验结果表明,RDP K-means算法在Calinski-Harabaz指数、轮廓系数、戴维森堡丁指数三种内部聚类评价指标下效果均优于传统的K-means、PCA K-means、层次聚类、DBSCAN等算法,证明了RDP K-means算法在基于余票查询数据的OD客流特征分析研究中的有效性,能够更好地进行OD类别划分、客流出行特征分析、热门OD挖掘,为改善运力调整等相关业务提供一定的参考依据。  相似文献   

5.
为快速准确地找到复杂网络的社团划分结果,引入相似度指标,提出一种改进的社团划分算法。将网络节点拓扑结构信息作为节点的多维属性,在不改变网络连边的情况下,使输入网络转换为节点多属性网络,并定义节点之间的混合相似度与社团相似度,运用层次聚类思想得到最终的社团划分结果。在真实网络、计算机生成网络上的实验结果表明,该算法能够发现明显的社团结构,并且具有较高的社团划分准确率。  相似文献   

6.
针对传统灰聚类法对聚类对象间的关系信息和属性间的差异信息利用不充分、灰类划分宽泛、聚类结果约束相对严格、完备性不足等问题,提出一种面向对象多属性差异的矩阵型灰色聚类方法。该方法充分利用对象已有的多属性信息,可以在不同的属性类别组合上获得多元、客观的聚类结果,使对象的分类更贴近于实际。通过对安徽省国家级贫困县进行聚类分析,展示了矩阵型灰色聚类方法的应用,表明了矩阵型灰色聚类方法的实用性和有效性。  相似文献   

7.
集群资源模糊聚类划分模型   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种集群资源模糊聚类划分模型。对计算机集群中计算节点的CPU、内存、网络、I/O和网卡资源参数进行量化和规范化,运用模糊聚类技术,实现计算节点的聚类划分。引入任务资源需求向量和最低误差容忍向量,将计算机集群划分为若干个性能均衡的逻辑子群。测试结果表明,该模型能有效划分计算机集群,适用于云计算领域的资源调度。  相似文献   

8.
实际应用中存在着大量同时具有数值型和符号型属性的混合属性数据,研究混合属性数据的聚类具有重要意义。经典聚类算法仅仅处理数值型数据或符号型属性数据,对混合属性数据往往无效。现有混合属性数据聚类算法分别将数值型属性和符号型属性数据单独计算,忽视了两种属性之间的相关性,聚类效果不理想。提出一种基于图划分的混合属性数据聚类算法。算法将一行属性值定义为一个图节点,计算图节点的相似性,采用一种自适应调节属性权重的方法,将数值和符号属性的相似性统一成一个互联合相似度矩阵。用图划分方法对数据进行聚类划分,通过迭代寻优的方法调整数据之间的契合度,从而求得类内相似度最大并寻得最优解。实验结果表明,混合属性聚类算法与其他方法相比具有明显的优势。  相似文献   

9.
王欣艺 《福建电脑》2013,29(3):129-131,139
当查询比较模糊,检索到的结果文档中表达了对查询的不同解释时,就要根据用户的相关反馈对返回结果进行聚类,本章首先介绍了一种著名的基于划分的聚类方法 K-均值算法。这种算法虽然效果显著,却无法处理类别属性的聚类任务。因此,本文基于层次分类方法,设计了一种针对类别属性分类的聚类算法,使其聚类后的返回结果具有高正确率的特点。  相似文献   

10.
春节是我们中国人民传统中最隆重的节日,这导致春运期间各种交通工具运输能力的紧张。铁路的服务能力也在春运期间最受考验。铁路部门不得不在有限的铁路线上增开临时旅客列车,但是客运决策者开行临客列车的依据是什么?以往靠的是经验,而如今更多的是依靠先进的计算机信息技术,因此,春运期间的铁路信息化运用有重要意义,同时也是提天,客票系统售出的客票张数达到1.也最能体现其助力铁路跨越式发展的高铁路客运经营水平,增强铁路客运1亿张,日均278.3万张,高峰日达成果。这其中,三大系统功不可没。市场竞争能力的有力措施。到362.9万张。客票…  相似文献   

11.
张新常  王正  罗万明  阎保平 《软件学报》2010,21(8):2010-2022
提出了一种具有拓扑感知能力的拓扑簇模型TCM(topology-aware clustering model),并在此基础上提出了一种有效的应用层组播方案TCMM(TCM-based multicast).TCMM能够将一些相近的节点组织在一个拓扑簇中,从而在一定程度上实现了数据包的本地传输,并能缓解不同加入顺序对转发树的不利影响.分析和实验结果表明,TCMM能够实现有效的聚簇,能够在不同的加入顺序下构造性能大体一致的转发树,并能在不同程度上改善其他一些组播性能指标.  相似文献   

12.
利用基于网格的遗传算法解决城市公共交通运营中的运行计划编制问题.首先应用有序样奉聚类算法对城市公交历史客流量样本数据进行数据挖掘,然后在综合考虑乘客待车成本和公交公司运营亏损等因素的前提下构造遗传算法的适应度甬数、编码方式和约束条件,最后在网格平台上初始化箅法种群,并分配不同的子种群到网格的各个集群、节点上并行地进行选择、交叉、变异及计算染色体的适应度等进化操作,同时以一定的规律在集群和集群、节点和节点之间交换优秀染色体,从而能快速得出满意的运行计划时刻表;通过仿真实验,证明了该方法的有效性和实时性.  相似文献   

13.
基于复杂网络的城市公共交通网络研究   总被引:7,自引:2,他引:5       下载免费PDF全文
顾前  杨旭华  王万良  王波 《计算机工程》2008,34(20):266-268
将北京、上海和杭州3个大城市的公共交通网络(常规公交和快速公交)抽象成复杂网络,结合网络图论思想,把公交站点作为节点,站点间的连线作为边,在大量统计数据的基础上,通过Space L和Space P方法研究3大城市的复杂网络特性。统计分析表明,3个城市的公交网络均具有较小的平均路径长度,即典型的小世界特性。其节点的度分布,在Space L方法的描述下具有无标度特性,在Space P方法的描述下具有指数分布特性。通过对Space L和Space P两种描述方法的比较,可以发现对于同样的公交网络,Space P方法描述的网络具有更大的聚类系数和更小的平均路径长度,即具有更强的小世界效应。  相似文献   

14.
A DAG (direct acyclic graph) is an important data structure which requires efficient support in CAD (computer-aided design) databases. It typically arise from the design hierarchy, which describes complex designs in terms of subdesigns. A study is made of the properties of the three types of clustered sequences of nodes for hierarchies and DAGs, and algorithms are developed for generating the clustered sequences, retrieving the descendants of a given node, and inserting new nodes into existing clustered sequences of nodes which preserve their clustering properties. The performance of the clustering sequences is compared  相似文献   

15.
图数据隐私保护的研究目前主要集中在简单图,适应范围有限。将权重图数据的隐私保护作为研究对象,可以改善权重图发布之后数据的可用性及有效性。针对在利用聚类匿名化方法处理社交网络数据时,需要增删大量的边和节点,造成严重的数据失真的问题进行了研究。提出了(k,l)加权社交网络匿名算法KFCMSA(联合k成员模糊聚类和模拟退火),并利用改进的簇划分算法将权重社交网络聚类成不同的簇,对同一簇中节点的边权重进行泛化使节点满足l多样性。在实现k度匿名的同时有效减少了边的改变量,提高了数据的可用性,实现最优聚类的同时防止了同质性攻击。聚类质量实验和数据可用性分析表明该算法具有较高的性能优势和较高边保留率。  相似文献   

16.
In this article, two clustering techniques based on neural networks are introduced. The two neural network models are the Harmony theory network (HTN) and the self‐organizing logic neural network (SOLNN), both of which are characterized by parallel processing, a distributed architecture, and a large number of nodes. After describing their clustering characteristics and potential, a comparison to classical statistical techniques is performed. This comparison allows the creation of a correspondence between each neural network clustering technique and particular metrics as used by the corresponding statistical methods, which reflect the affinity of the clustered patterns. In particular, the HTN is found to perform the clustering task with an accuracy similar to the best statistical methods, while it is further capable of proposing an optimal number of groups into which the patterns may be clustered. On the other hand, the SOLNN combines a high clustering accuracy with the ability to cluster higher‐dimensional patterns without a considerable increase in the processing time. © 2003 Wiley Periodicals, Inc.  相似文献   

17.
任秀丽  彦琨 《计算机应用》2016,36(10):2653-2658
针对交通监控中突发数据实时性问题,提出一种基于模糊聚类的媒体访问控制(FC-MAC)协议。该协议采用时分多址(TDMA)和改进的载波监听多路访问冲突避免(CSMA/CA)交替工作的方式,既保证了普通周期数据的传递,又增强了突发数据的实时性。在CSMA/CA阶段,提出模糊聚类分析的方法,根据因素向量聚类簇内节点,使节点突发数据具有不同的优先级,优先级高的突发数据更早接入信道完成传输;同时,根据该协议的时隙分配策略,提出一种基于分层随机延迟的方法,减少同一时段内竞争接入Sink节点的簇头数量,降低簇头节点之间因退避而产生的数据延迟。仿真结果表明:FC-MAC在能量消耗上介于混合型Z-MAC协议与调度型S-LMAC协议之间;在突发数据平均时延减少的情况下,网络吞吐量比Z-MAC提高了11.2%,比S-LMAC提高了21.3%,并且对网络业务流量具有更好的适应性。  相似文献   

18.
多层自动确定类别的谱聚类算法   总被引:1,自引:0,他引:1  
金慧珍  赵辽英 《计算机应用》2008,28(5):1229-1231
自动确定聚类数和海量数据的处理是谱聚类的关键问题。在自动确定聚类数谱聚类算法的基础上,提出了一种能处理大规模数据集的多层算法。该算法的核心思想是把大规模数据集根据一定的相关性逐级进行合并,使之成为小数据集,再对分组后的小数据集用自动确定类别的谱聚类算法聚类,最后逐层进行拆分并微调, 完成全部数据的聚类。实验证明该算法的聚类效果很好。  相似文献   

19.
针对胃癌患者住院费用分类标签设定的复杂性以及传统费用建模算法的局限性, 本文提出了一种基于聚类和支持向量机的住院费用建模算法, 为胃癌患者住院费用的控制和预测提供方法基础. 搜集整理宁夏某三甲医 院2009–2011年间1583例胃癌患者为样本, 采用K-means对总住院费用逐年聚类得到分类标签, 最后通过支持向量机对住院费用进行建模预测以及影响因素分析, 用分类准确率作为预测效果的评价指标. 实验结果表明胃癌患者住院费用呈逐年增加趋势, 其中以西药费为主, 占总费用的53.74%. 通过K-Means以年份对费用聚类比单纯以费用分布特征聚类的分类准确率提高了13.13%, 当核函数选用高斯核函数, 且惩罚因子C = 10和核参数 = 1时建立的支持向量机模型最稳定, 分类准确率为92.11%. 实验结果表明根据年份聚类得到类别标签更合理, 结合聚类的SVM来预测住院费用更有效.  相似文献   

20.
根据南中轴路BRT智能公交系统的实际应用情况,提出了一种BRT行车计划编制的优化方案:利用装载了智能车载设备的快速公交车(即Probe car)采集车辆信息、客流信息、路况信息等,统计分析出BRT车辆运营规律以及线路客流分布特征,按照车辆运营指标,优化制定行车计划.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号