首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 122 毫秒
1.
2.
目前随着信息检索技术的不断深入,信息检索技术中的聚类分析也得到了不断的发展,特别是随着各种数据源的大量涌现,如图像数据,文本数据,DNA数据,时间序列数据,Web数据等等,聚类分析越来越受到重视,对聚类的研究已经成为信息检索领域中一个非常活跃的研究课题。论文以聚类分析方法为理论基础,利用面向对象编程技术完成了一个聚类软件,应用该聚类软件,可对信息实现快速检索,具有实用价值。  相似文献   

3.
基于Agent的模式识别框架APRF(agent-oriented pattern recognition frame).先用自下而上方法对模式建模,然后再自上而下对模式分类.让计算机模式识别更符合人的认知过程的特点,然后阐述APRF在聚类分析中的应用.  相似文献   

4.
一种新的聚类分析算法   总被引:5,自引:0,他引:5       下载免费PDF全文
给出了一种新的无监督聚类算法,但这种算法并非是基于目标函数的聚类算法,而是对数据直接设计一种迭代运算,以使数据在保持类特征的情况下进行重新组合最终达到分类的目的。通过对一类数据的实验表明,该算法在无监督给出类数方面具有较好的鲁棒性;另外,该算法在数据的准确归类、无监督聚类、确定性,以及对特殊类分布的适用性等方面均优于HCM和FCM算法,  相似文献   

5.
聚类分析研究进展   总被引:4,自引:0,他引:4  
聚类是数据挖掘中重要的研究课题,是数据挖掘中一种重要的挖掘任务和挖掘方法.介绍聚类分析及其过程,讨论划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法等聚类算法及其不足之处,提出聚类研究今后的发展趋势及研究重点.  相似文献   

6.
聚类分析在搜索引擎中的应用   总被引:8,自引:0,他引:8  
为了快速、准确地从因特网上找到人们所需的信息,对网页信息进行聚类分析是非常重要的。该文分析了几种适用于搜索引擎的聚类方法,并讨论了聚类分析在设计搜索引擎时的应用。  相似文献   

7.
一种快速山峰聚类算法   总被引:1,自引:1,他引:0  
山峰聚类既可以对数据集进行近似聚类,又可以为其他聚类方法提供聚类所需的初始聚类中心。减法聚类是山峰聚类的改进,它避免了山峰聚类中出现的计算量随样本维数增加呈指数增长的情况。但减法聚类对处理大样本集也力不从心。引入了P-tree数据结构,对高维大样本集进行分解,然后用减法聚类对子样本集进行聚类。此算法既避免了山峰聚类的维数灾难问题,也解决了减法聚类中样本数太大的问题。实验结果证明,该算法有效地减少了运算量,提高了聚类的速度。  相似文献   

8.
文章对聚类分析方法进行了简要介绍,并主要对其中的层次聚类方法进行了研究,将该方法引入到中医药领域中,以治疗糖尿病的中药为试验数据,对中药的性味作了聚类,初步取得了符合中医理论的结果,对数据挖掘在中医药中的应用做了有益的探索。  相似文献   

9.
基于数据对象间的关联限制定义了类间关联系数,本文提出了两阶段的限制层次聚类算法TCCL.算法分为两个阶段,第一阶段主要依据数据对象的自然分布,基于数据对象间的距离把它们合并入一个个小类;在第二阶段,依据背景知识,基于类间关联系数来实现小类的进一步合并.一些实际数据集的实验结果表明,TCCL可以比较有效地利用所给关联限制来改善聚类效果.  相似文献   

10.
朱强 《现代计算机》2007,(4):87-88,94
分析了常用的数据挖掘方法,在数据挖掘中引入了模糊聚类分析的方法,分析了该方法在数据挖掘中的优势,并以例证说明这一方法的实际应用。  相似文献   

11.
聚类是一种寻找数据之间内在结构的技术,是许多数据驱动应用领域的一个基本问题,而聚类性能在很大程度上取决于数据表示的质量。近年来,深度学习因其强大的特征提取能力被广泛地应用于聚类任务,以学习更好的特征表示,显著提高了聚类性能。首先,介绍了传统的聚类任务;然后,根据网络结构介绍了基于深度学习的聚类及代表性方法,指出了当前存在的问题,并介绍了基于深度学习的聚类在不同领域的应用;最后,对基于深度学习的聚类发展进行了总结与展望。  相似文献   

12.
提出了一种新的基于Vague相似关系的聚类方法。通过构造Vague相似关系矩阵,运用编网法进行模糊聚类分析,使得聚类分析的结果更加全面。用具体实例验证方法的有效性。  相似文献   

13.
首先对P2P覆盖网中的聚类技术进行了分类,在此基础上介绍了各种典型的聚类方法并进行了对比分析;最后指出了P2P覆盖网中聚类技术的未来研究趋势。  相似文献   

14.
随着计算机和传感技术的发展,大量生产过程数据被记录。提取数据中的知识信息是提高产品质量的重要手段,通过聚类分析可以了解生产状态,进行生产故障诊断或有针对性的质量检测,谱聚类是较为先进的聚类方法,而传统的谱聚类中使用欧式距离作为相似性的度量,但欧式距离只能反映数据空间分布为球形或超球形的结构特性,难以刻画复杂数据分布特性,将测地距离引入谱聚类中,并应用于生产过程状态的聚类分析中,分别利用标准数据、TE生产过程数据对方法的有效性进行验证,结果表明测地距离谱聚类方法可以降低参数的敏感性,且具有更优的聚类结果,可以更加有效了解生产过程状态。  相似文献   

15.
实际生产过程呈现多模态,通过聚类分析可以了解生产状态,进行生产故障诊断或有针对性的质量检测,传统的线性分析方法难以有效提取非线性特性。谱聚类是较为先进的聚类方法,但常规的谱聚类分析是按照特征值的大小来进行特征选择的,而特征值的大小表示数据在特征向量上的方差信息;实际生产过程数据分布复杂,将熵值估计引入谱聚类特征选择中,并应用于生产过程状态的聚类分析中,分别利用标准数据、TE生产过程数据对方法的有效性进行验证。验证结果表明熵值评估谱聚类方法取得了更优的聚类结果,可以更加有效了解生产过程状态。  相似文献   

16.
在智能系统的研究与开发中,聚类分析是一个非常重要的问题。提出了一个基于未知度和核的Vague集间的相似度量公式。在考虑算法自主性和计算复杂性的基础之上,通过参考Fuzzy集中的相关聚类分析方法,给出了一种以Vague集的相似度量为评价准则的直接聚类算法。使用相似度量公式,分别采用Vague 传递闭包法和Vague 直接聚类法进行计算,实验结果表明,基于Vague 相似度量的直接聚类法计算简单,不会造成原始信息的失真,而且对数据量的大小均无特别的要求,比Vague 传递闭包法更加有效。  相似文献   

17.
聚类有效性评价综述*   总被引:11,自引:3,他引:8  
在聚类分析应用中,迫切需要一种客观公正的质量评价方法来评判聚类结果的有效性。为此,从外部评价法、内部评价法和相对评价法三个方面,归纳综述了常用的聚类有效性评价方法,并讨论了模糊聚类评价法和聚类最佳类别数的自动确定问题。  相似文献   

18.
首先总结了链接挖掘中基于属性—链接聚类算法的研究现状;然后把它大体分为三类,对每一类中具有代表性的算法进行了详细介绍、分析和评价;最后指出了该领域进一步的研究方向。  相似文献   

19.
聚类分析在模式识别和图像处理领域中有着极为重要的意义和广泛的应用前景。常用的聚类分析的方法是模糊C均值算法(FCM),但是FCM算法容易陷入局部最优解。提出一种基于FCM和遗传算法对图像进行模糊聚类分析的方法。对输入图像进行纹理特征提取,通过主成分分析法对提取的特征向量进行降维处理,降低图像聚类分析算法的复杂度,提高结果的精确度,结合FCM和遗传算法对图像数据进行模糊聚类分析。实验结果表明该方法可以得到较好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号