首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 296 毫秒
1.
一种k-means聚类的案例检索算法   总被引:2,自引:1,他引:1       下载免费PDF全文
针对CBR系统中案例检索算法存在的问题,根据k-means算法思想,将案例库进行聚类,在聚类基础上设计了一个案例检索算法。分析了样本案例的选取规则,重点论述了案例检索算法。根据实验结果表明,该方法能够有效地提高案例检索结果的召回率及案例检索效率。  相似文献   

2.
陈千  向阳  郭鑫  王栋 《计算机科学》2010,37(12):161-164
在基于本体的案例检索系统中,由于数据库中的案例数量随着时间的推移而成倍增加,案例检索的效率不断降低,因此如何有效地提高案例检索系统的效率是个亚待解决的问题。提出一种基于粗糙集的k-means聚类算法,在用户检索之前对案例库中成千上万的案例进行有效聚类,从中定义基于粗糙集的聚类中心和上下近似以及边界。实验证明,该方法在系统检索时不必对每个案例都进行相似度的计算,从而大大提高了检索性能。  相似文献   

3.
为解决传统相似案例检索方法在数字电影大型案例库中检索效率低下的问题,针对数字电影大型案例库进行了研究分析,从提高案例检索速度和参考价值的角度出发,提出了一种聚类、优选和匹配相结合的相似案例检索方法.通过聚类缩小案例的检索范围,通过优选在相应的检索范围内形成参考价值较高的候选案例集,通过匹配算法在候选案例集中寻找最相似案...  相似文献   

4.
针对目前基于案例推理系统中案例检索存在的问题,根据K-means算法思想,分别设计一个案例聚类算法及案例检索算法。根据K-means算法的不足,对初值选取规则及案例检索算法进行改进。分析基于案例权重的样本案例选取规则,并论述案例聚类算法和检索算法。实验结果表明,该方法能有效提高案例检索效率及案例检索结果的召回率。  相似文献   

5.
案例推理作为人工智能领域中通过已知知识解决问题的方法,其核心之一是检索算法。为了改善案例推理检索算法的预测结果质量,提出一种改进的KNN案例推理检索算法。首先,利用遗传模拟退火-模糊C均值聚类算法对案例库聚类,形成多个类簇;其次,通过改进的粒子群优化混合算法优化各类簇近邻K值;然后提出最优原则检索策略,确定检索子案例库及近邻K值;最后使用Mackey-Glass混沌时间序列数据进行仿真预测。实验结果表明,相较于传统KNN案例推理检索算法,改进的KNN案例推理检索算法预测结果的精度显著提高。  相似文献   

6.
乔丽 《计算机工程》2012,38(6):201-203
在基于K-means的案例检索算法中,目标案例初次映射的失败会导致案例检索成功率降低。针对该问题,提出一种基于滑动窗口的案例检索算法。分析滑动窗口维护策略,利用滑动窗口收集案例库中权重较高且最近常使用的案例,增加案例采样数量。实验结果表明,该算法能提高检索成功率,检索时间较短且案例映射次数较少。  相似文献   

7.
基于案例推理的信息系统业务流程知识重用技术研究   总被引:1,自引:0,他引:1  
本文在研究信息系统业务流程设计的知识表示与重用技术的基础上,提出了一种基于案例的智能化设计知识重用方法进行信息系统业务流程设计.重用方法包含案例表示、基于相似度算法和智能聚类的案例检索、案例优化、案例库组织四个方面.综合四个方面,实现了基于案例推理的业务流程案例检索和知识重用实验系统原型,并进行了实验.实验结果表明本重用方法具有较好的可行性、有效性、效率与质量.  相似文献   

8.
为了实现对煤与瓦斯突出快速、准确和动态预测,考虑煤与瓦斯突出多种影响因素,提出了一种基于聚类和案例推理(CBR)的煤与瓦斯突出预测方法。利用通过一种基于PCA的描述案例特征权值确定方法所得的描述案例特征权值,对案例库案例进行聚类,使同类案例间具有较高的相似度;以案例聚类结果为基础,进行高效案例检索与匹配,以提高煤与瓦斯突出预测的快速性。利用实测数据对所提方法进行验证,实例验证结果表明,所提方法预测结果的准确性高,预测所用平均时间是已有煤与瓦斯突出预测案例推理方法预测所用时间的40%。  相似文献   

9.
聚类分析方法在基于案例推理系统中的应用   总被引:1,自引:0,他引:1  
胡学东  侯燕 《微机发展》2004,14(12):32-35
在基于案例推理的系统中,案例检索是一个关键的问题,案例检索的速度不仅与案例检索算法有密切关系,而且同案例库所使用的索引方法也有着紧密联系。准确、快速地获得案例的解决方案是评价基于案例推理系统的一个重要方面。当案例库中的案例数量较多时,案例的检索速度问题更为突出,采用多级索引的技术可以有效提高案例检索的速度。文中分析了如何采用聚类分析的方法来为案例库建立多级索引。  相似文献   

10.
在基于案例推理的系统中,案例检索是一个关键的问题,案例检索的速度不仅与案例检索算法有密切关系,而且同案例库所使用的索引方法也有着紧密联系.准确、快速地获得案例的解决方案是评价基于案例推理系统的一个重要方面.当案例库中的案例数量较多时,案例的检索速度问题更为突出,采用多级索引的技术可以有效提高案例检索的速度.文中分析了如何采用聚类分析的方法来为案例库建立多级索引.  相似文献   

11.
针对基于密度的噪声应用空间聚类算法(density based spatial clustering of applications with noise,DBSCAN)计算复杂度较高以及无法聚类多密度数据集等问题,提出了一种网格聚类算法和DBSCAN相结合的融合聚类算法(G_FDBSCAN)。利用网格划分技术将数据集划分为稀疏区域和密集区域,分而治之,降低计算的时间复杂度和采用全局参数引起的聚类误差;改进传统的DBSCAN聚算法得到FDBSCAN,将密集区域中网格聚类的结果作为一个整体参与后续的聚类,在网格划分基础上进行邻域检索,减少邻域检索和类扩展过程中对象的无效查询和重复查询,进一步减少时间开销。理论分析和实验测试表明,改进后的算法与DBSCAN算法、DPC算法、KMEANS算法、BIRCH算法和CBSCAN算法相比,在聚类结果接近或达到最优的情况下,聚类效率分别平均提升了24倍、11倍、2倍、3倍和1倍。  相似文献   

12.
In this research, we address the query clustering problem which involves determining globally optimal execution strategies for a set of queries. The need to process a set of queries together often arises in deductive database systems, scientific database systems, large bibliographic retrieval systems and several other database applications. We address the optimization problem from the perspective of overlaps in data requirements, and model the batched operations using a set-partitioning approach. In this model, we first consider the case of m queries each involving a two-way join operation. We develop a recursive methodology to determine all the processing strategies in this case. Next, we establish certain dominance properties among the strategies, and develop exact as well as heuristic algorithms for selecting an appropriate strategy. We extend this analysis to a clustering approach, and outline a framework for optimizing multiway joins. The results show that the proposed approach is viable and efficient, and can easily be incorporated into the query processing component of most database systems  相似文献   

13.
为提高三维模型的检索性能,将聚类分析用于特征描述符的提取以及模型间相似性关系划分等方面,能够对三维模型进行较为合理的分类,对较大规模三维模型数据库的索引和组织进行完善,提高三维模型检索效率。针对当前主流的基于聚类的三维模型检索算法进行分析,比较几种聚类算法的优势与不足,在其基础上进行改进,并继续应用于三维模型的检索中。  相似文献   

14.
一种面向并行空间查询的数据划分方法   总被引:1,自引:0,他引:1  
在并行空间数据库中,空间数据集在各计算节点是否聚集划分,对提高空间并行查询效率起着关键的作用.Oracle Spatial采用的基于格网的划分方法只考虑了数据集在各节点是否均衡划分,而未考虑空间数据的拓扑特征.基于空间数据聚集划分的目的,提出了一种基于K-平均聚类算法的空间数据划分方法.实验证明,该方法极大地提高了空间数据并行检索和查询效率.  相似文献   

15.
虚拟物流企业已成为21世纪信息社会生产、物流的主流组织形式。准确地选择和确定合作伙伴是建立虚拟物流企业的关键。本文提出了应用基于网格的聚类算法来选择虚拟物流企业合作伙伴。该算法能对虚拟物流企业信息平台提供的庞大的高维的成员企业信息数据库进行快速有效的数据挖掘,从而在全球范围内寻找潜在的合作伙伴,以供虚拟物流企业核心企业作为下一步精选的根据。实例仿真说明了该算法的有效性。  相似文献   

16.
提出了一种基于主颜色、聚类索引表的彩色图像检索算法。应用MPEG-7视觉内容描述对彩色图像进行量化处理,选取图像的主颜色及其所占百分率作为颜色特征,根据主颜色组合建立聚类索引数据库。利用上述主颜色特征计算图像间的相似度,利用聚类索引表对图像进行聚类和快速检索。实验表明,该算法能够准确和高效地检索出用户所需的彩色图像,具有较快的检索速度。  相似文献   

17.
邢长征  胡权波 《计算机工程》2013,(12):247-250,259
处理倾斜分布特征的数据流聚类算法TDCA存在聚类速度与内存利用率上的不足,且变流速的数据流环境对聚类结果的质量有严重影响。针对上述问题,提出一种数据流聚类算法GR—Stream。采用网格单元作为数据点的聚集形式,以基于R.tree的扩展数据结构作为组织网格单元的索引结构,在此基础上引入剪枝策略,并调整数据点进入树的方式。在真实数据集KDD.CUP99上进行测试,结果表明,与TDCA算法相比,该算法在聚类过程中可以提高40%的访问速度,应用剪枝策略节省至少一半的内存使用量,同时在变流速的数据流环境下将聚类结果的平均纯度保持在90%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号