首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对关系数据库元组级别关键词检索中存在查询语句多义性及展现结果冗余性等问题,提出一种关系数据库对象级别检索结果的聚类方法。以对象的观点,综合考虑检索结果的相关性和多样性,从结构和内容两个层面对其聚类。基于覆盖树对检索结果进行同构判断,实现第一级聚类;利用核函数计算同构类别中检索结果间所包含内容的相似性,实现第二级聚类;同时对聚类后的结果集进行动态更新。该聚类方法有效降低了展现结果的冗余性,增加了用户可选择的结果类别,提高了检索系统的性能。  相似文献   

2.
一种新的Web检索结果聚类方法   总被引:1,自引:0,他引:1  
Web检索结果聚类用于检索结果的组织,以方便用户的浏览.从一个新的角度审视检索结果聚类.通过分析检索结果的特点,由此提出计算检索结果中的词语与用户输入的关键词拱现程度,然后根据共现程度高的词语确定基类,最后利用类标签的语聚类得到层次聚类结果.此基于词间共现度及词语语义的新方法为Web检索结果聚类提供了一个新的思路.  相似文献   

3.
一种基于颜色信息的图象检索方法   总被引:1,自引:0,他引:1       下载免费PDF全文
由于传统的基于颜色的图象检索都是基于颜色直方图的检索,其很难将颜色信息和其他信息结合起来,因此,降低了图象检索的准确度.为了提高图象检索的准确度,提出了一种基于颜色聚类表的图象检索方法,该方法首先定义颜色聚类表,并对图象进行颜色聚类;然后利用聚类后的颜色信息构造聚类表,并利用聚类表作为特征来对图象进行检索,同时给出颜色聚类表的获取方法;最后,利用该方法进行了仿真实验.实验结果表明,利用颜色聚类表,根据图象的聚类结果来实现检索,可以很方便地将颜色信息与其他信息结合起来.  相似文献   

4.
将数据挖掘的聚类算法应用到基于内容的图像检索中可以有效提高检索的速度和效果。模糊聚类算法更符合图像检索本身所具有的模糊性,但这种方法存在聚类分析时间过久影响检索性能的问题,因此本文提出了一种基于优化分块颜色直方图及模糊C聚类的彩色图像检索方法。首先对图像库中的每幅图像进行分块,并提取出每一块的优化颜色特征信息;然后采用模糊C均值聚类算法对得到的颜色特征向量进行聚类,得到每个图像类的聚类中心;最后计算查询示例图像和对应图像类的图像之间的相似度,按照相似度的大小返回检索结果。实验表明,本文提出的方法不仅具有较高的查全率和查准率,而且提取的特征维数较少,聚类时间短,检索速度快。  相似文献   

5.
针对目前基于案例推理系统中案例检索存在的问题,根据K-means算法思想,分别设计一个案例聚类算法及案例检索算法。根据K-means算法的不足,对初值选取规则及案例检索算法进行改进。分析基于案例权重的样本案例选取规则,并论述案例聚类算法和检索算法。实验结果表明,该方法能有效提高案例检索效率及案例检索结果的召回率。  相似文献   

6.
提出一种基于K-means算法和相关反馈信息的图像检索方法。首先运用环形分块策略对图像进行划分,运用分块加权方法进行图像相似性比较,突出了图像中心的主体地位。对图像样本数据运用K-means方法进行聚类,采用差分进化算法确定初始聚类中心,减少聚类结果对初始聚类中心的依赖性和聚类结果不稳定等问题。在图像检索过程中,根据检索结果进行相关信息反馈,必要时对样本数据重新进行聚类操作,以提高图像检索的准确率和查全性,满足用户需求。  相似文献   

7.
提出基于遗传FCM聚类算法和SVM相关反馈的图像检索方法。首先对图像库提取颜色和纹理特征,采用遗传FCM聚类算法对图像进行聚类,得到每个图像类的聚类中心;最后计算查询示例图像和对应图像类的图像之间的相似度,按照相似度的大小返回检索结果。为了进一步提高检索精度,提出基于SVM的相关反馈算法。实验结果表明,提出的方法具有优良的检索性能。  相似文献   

8.
基于网格聚类的案例检索策略   总被引:3,自引:1,他引:2       下载免费PDF全文
基于案例推理的智能推荐系统是大型科学仪器协作共用网的重要组成部分。通过对案例库按网格进行聚类,设计并实现一个基于异构案例库的检索策略。分析案例库网格划分原则及案例聚类规则,论述案例聚类算法及在聚类基础上的案例检索策略。实验结果表明,该方法能够有效地降低案例检索时间,提高案例库的可维护性。  相似文献   

9.
为了解决搜索引擎检索结果中的主题混杂现象,帮助用户快速准确地定位到有价值的信息,提出基于主题短语的搜索引擎结果聚类方法。首先从检索结果中提取查询词并与相邻词语组成主题短语,建立包含高频独立词语及主题短语的混合向量空间模型,同时引入同义词词林对特征项进行语义扩充,最后采用改进的k-means聚类算法对搜索结果进行聚类,并为各个类别提取类别标签。实验结果表明,该算法能有效提高聚类结果的准确率。  相似文献   

10.
针对大规模三维网格模型库中的形状检索问题,提出了基于增量式聚类的三维形状描述和检索方法。首先根据三维模型的曲率分布直方图提取特征点得到特征向量;然后根据特征向量描述建立模型库的关键词词典;在特征 匹配阶段基于增量聚类方法判断目标模型的特征向量是否属于某一个关键词,并根据增量聚类的结果更新检索关键词词典;最后匹配特征向量检索模型库中与目标模型形状相同和相近的三维网格模型。相关实验结果证明了该方法快速有效,具有较高的准确性。  相似文献   

11.
面对复杂信息环境下的数据预处理需求,提出了一种可以处理混合属性数据集的双重聚类方法。这种双重聚类方法由双重近邻无向图的构造算法或其改进算法,基于分离集合并的双重近邻图聚类算法、基于宽度优先搜索的双重近邻图聚类算法、或基于深度优先搜索的双重近邻图聚类算法来实现。通过人工数据集和UCI标准数据集的仿真实验,可以验证,尽管这三个聚类算法所采用的搜索策略不同,但最终的结果是一致的。仿真实验结果还表明,对于一些具有明显聚类分布结构且无近邻噪声干扰的数据集,该方法经常能取得比K-means算法和AP算法更好的聚类精度,从而说明这种双重聚类方法具有一定的有效性。为进一步推广并在实际中发掘出该方法的应用价值,最后给出了一点较有价值的研究展望。  相似文献   

12.
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。  相似文献   

13.
一种基于聚类技术的个性化信息检索方法   总被引:7,自引:2,他引:5       下载免费PDF全文
实践证明聚类技术是改进搜索结果显示方式的一种有效手段。然而,目前的聚类方法没有考虑到用户兴趣,对于相同的查询,返回给所有用户同样的聚类结果。由此提出一种个性化聚类检索方法。该方法改进了k-means算法,利用该算法对传统搜索引擎返回的结果结合用户兴趣进行聚类,返回针对特定用户的网页簇。实验证明该方法能够提供个性化服务,改善了聚类的效果,提高了用户的检索效率。  相似文献   

14.
针对模糊聚类算法中存在的对初始值敏感、易陷入局部最优等问题,提出了一种融合改进的混合蛙跳算法(SFLA)的模糊C均值算法(FCM)用于Web搜索结果的聚类。新算法中,使用SFLA的优化过程代替FCM的基于梯度下降的迭代过程。改进的SFLA通过混沌搜索优化初始解,变异操作生成新个体,并设计了一种新的搜索策略,有效地提高了算法寻优能力。实验结果表明,该算法提高了模糊聚类算法的搜索能力和聚类精度,在全局寻优能力方面具有优势。  相似文献   

15.
随着人们在互联网上的行为日益丰富,互联网上的社交行为和关系逐渐接近传统的客观世界的社交网络,并能够真实反映出人与人之间在客观世界的真实关系。可以从互联网中通过搜索的方式来构建一个真实客观世界的社会网络。社会网络搜索技术及其方法逐渐成为目前的研究热点,如何对每个Web进行人名同一性判断是社会网络搜索的关键技术。为了从文本中抽取准确的特征并降低向量维度,本文给出了一个基于C-value和逆文档频率IDF的特征向量权值计算方法;实现了基于余弦夹角的相似度计算的算法;通过对文本聚类算法中层次聚类算法和划分聚类算法的研究,给出一种改进的层次聚类算法来实现人名同一性判断。以搜索引擎的人名检索结果进行测试,说明了基于改进的层次聚类算法能有效地提高人名同一性判断的性能。  相似文献   

16.
卫琳 《微机发展》2007,17(9):65-67
搜索引擎返回的信息太多且不能根据用户的兴趣提供检索结果,使得用户使用搜索引擎难以用简便的方式找到感兴趣的文档。个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法。文中把内容过滤技术和文档聚类技术相结合,实现了一个基于搜索结果的个性化推荐系统,以聚类的方法自动组织搜索结果,主动推荐用户感兴趣的文档。通过建立用户概率兴趣模型,对搜索结果STC聚类的基础上进行内容过滤。实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化。  相似文献   

17.
数据聚类是大数据分析的基本手段,传统聚类方法易于陷入局部最优.针对这一问题,提出一种基于改进引力搜索机制GSA的数据聚类算法.定义一种适合于引力搜索进化的聚类解编码方式.为了衡量不同聚类解的差异,设计一种基于汉明距离的引力搜索粒子距离度量方法,有效衡量数据对象在各维度属性上的不同.同时,在粒子速度更新方面,引入加速因子...  相似文献   

18.
传统的搜索引擎性能评价方法需要人工标注标准答案集,需花费大量的人力物力,并且评价结果依赖于人工标注的准确性,效率较低。该文基于聚类分析的思路,提出了一种搜索引擎性能评价指标和自动进行搜索引擎性能评价的方法,此方法能自动计算信息类查询的覆盖范围,并根据其覆盖范围对检索结果进行聚类,通过类间距和类内距等指标实现检索性能的自动评价。实验结果表明,基于聚类指标的评价方法与人工标注的评价方法的评价结果是相一致的。  相似文献   

19.
为解决选定特征上的聚类问题和模糊C-均值聚类存在的初始值敏感、易陷入局部最优的问题,提出了一种基于改进萤火虫算法的模糊软子空间聚类方法。该方法在模糊C-均值聚类算法的基础上,采用基于数据可靠性的k-均值算法中特征权值的计算方法,并结合萤火虫算法的全局搜索能力对所有的特征子空间进行搜索;设计了一种目标函数来对聚类结果和子空间所包含的特征维进行评估,并利用目标函数改进了萤火虫算法的搜索公式。实验结果表明,该方法能有效地收敛于全局最优解,具有良好的聚类效果和抗噪性。  相似文献   

20.
为了解决聚类算法容易陷入局部最优的问题,以及增强聚类算法的全局搜索能力,基于KHM算法以及改进的引力搜索算法,本文提出一种混合K-调和均值聚类算法(G-KHM)。G-KHM算法具有KHM算法收敛速度快的优点,但同时针对KHM算法容易陷入局部最优解的问题,在初始化后数据开始搜索聚类中心时采用了一种基于对象多样性及收敛性增强的引力搜索算法,该方法改进了引力搜索算法容易失去种群多样性的缺点,并同时具有引力搜索算法较强的全局搜索能力,可以使算法收敛到全局最优解。仿真结果表明,G-KHM算法能有效地避免陷入局部极值,具有较强的全局搜索能力以及稳定性,并且相比KHM算法、K-mean聚类算法、C均值聚类算法以及粒子群算法,在分类精度和运行时间上表现出了更好地效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号