首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
模糊聚类算法在汉语文本聚类中的应用   总被引:8,自引:2,他引:8  
应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。  相似文献   

2.
聚类算法在范例库维护中的应用研究   总被引:7,自引:1,他引:6  
详细介绍了将传统的聚类算法应用于基于范例推理系统中,并为范例库维护提供了一条有效的途径。实验表明,在范例库的维护中,聚类方法是一种行之有效的方法。  相似文献   

3.
一种基于离群点信息的新型无监督聚类方法   总被引:2,自引:0,他引:2  
在图像检索领域,聚类分析技术有着广泛应用。因为在对图像进行聚类分析时,通常缺少可资利用的先验知识,所以需要采用无监督的聚类算法。为了适应图像检索的需要,提出了一种新型的无监督聚类方法,即根据离群点信息来自动确定聚类算法的终止时机。此方法还弥补了现有聚类算法在离群点识别、使用上的缺欠。为验证其可行性,用其改进了CURE和ROCK两个经典算法。实验表明,改进后的两个算法都能自动终止,并能取得优于以往的聚类效果。  相似文献   

4.
一种新的聚类分析算法   总被引:5,自引:0,他引:5       下载免费PDF全文
给出了一种新的无监督聚类算法,但这种算法并非是基于目标函数的聚类算法,而是对数据直接设计一种迭代运算,以使数据在保持类特征的情况下进行重新组合最终达到分类的目的。通过对一类数据的实验表明,该算法在无监督给出类数方面具有较好的鲁棒性;另外,该算法在数据的准确归类、无监督聚类、确定性,以及对特殊类分布的适用性等方面均优于HCM和FCM算法,  相似文献   

5.
基于类信息的文本聚类中特征选择算法   总被引:2,自引:0,他引:2  
文本聚类属于无监督的学习方法,由于缺乏类信息还很难直接应用有监督的特征选择方法,因此提出了一种基于类信息的特征选择算法,此算法在密度聚类算法的聚类结果上使用信息增益特征选择法重新选择最有分类能力的特征,实验验证了算法的可行性和有效性。  相似文献   

6.
旨在从无监督聚类角度分析实体解析过程的机制。从特定类型、经典算法角度研究了无监督聚类的思路;从经典算法改进、演化分析角度研究了无监督增量聚类的思路;最后,对无监督聚类研究下一步需要解决的问题进行了展望。无监督聚类技术不仅能很好地解决传统实体解析过程中存在的聚类效率和质量问题,而且还能利用已有的聚类结果对快速演化的数据进行增量解析,进而进一步满足大数据环境下亟需的增量解析需求。没有深入分析无监督聚类算法的评价指标,尽管面向实体解析的无监督聚类方法有诸多优势,但仍然面临着准确性和可扩展性等挑战。  相似文献   

7.
半监督的仿射传播聚类   总被引:4,自引:0,他引:4       下载免费PDF全文
仿射传播聚类算法快速、有效,可以解决大数据集的聚类问题,但当数据的聚类结构比较松散时,聚类准确性不高。该文提出了半监督的仿射传播聚类算法,在迭代过程中嵌入了有效性指标以监督和引导算法向最优聚类结果的方向运行。实验结果表明,该方法对于聚类结构比较紧密和松散的数据集,均可以给出较为准确的聚类结果。  相似文献   

8.
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

9.
基于改进的启发式蚁群算法的聚类问题的研究   总被引:1,自引:0,他引:1  
蚁群算法是优化领域中新出现的一种仿生进化算法,广泛应用于求解复杂组合优化问题,并已在通信网络、机器人等许多应用领域得以具体应用。聚类问题作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。基于蚁群算法的聚类算法已经在当前的数据挖掘研究中得到应用。文中针对早期蚁群聚类算法的缺点,提出一种改进的启发式蚁群聚类算法(IHAC),将蚁群在多维空间中移动的启发式知识存储在称之为“记忆银行”的设备当中,来指导蚁群后边的移动行为,降低蚁群移动的随意性,避免产生未分配的数据对象。并用一些数据做了一些实验,结果证明改进的蚁群聚类算法在误分类错误率和运行时间上优于早期的蚁群聚类算法。  相似文献   

10.
蚁群算法是优化领域中新出现的一种仿生进化算法,广泛应用于求解复杂组合优化问题,并已在通信网络、机器人等许多应用领域得以具体应用。聚类问题作为一种无监督的学习,能根据数据间的相似程度自动地进行分类。基于蚁群算法的聚类算法已经在当前的数据挖掘研究中得到应用。文中针对早期蚁群聚类算法的缺点,提出一种改进的启发式蚁群聚类算法(IHAC),将蚁群在多维空间中移动的启发式知识存储在称之为"记忆银行"的设备当中,来指导蚁群后边的移动行为,降低蚁群移动的随意性,避免产生未分配的数据对象。并用一些数据做了一些实验,结果证明改进的蚁群聚类算法在误分类错误率和运行时间上优于早期的蚁群聚类算法。  相似文献   

11.
镜头分割是基于内容的视频检索首先要解决的关键技术。一般聚类算法可能导致帧序不连续或分割错误,并且现有的分割算法基本上都是对镜头中连续帧依次进行比较,效率比较低;为了解决以上问题,提出了一种改进的镜头分割算法-基于聚类的间隔帧分割算法,在此算法引入了参考变量,镜头中的很多帧不需进行比较。实验表明本算法(采用颜色直方图作为切变判别依据)在镜头分割中提高了效率,并且提高了分割的准确率。  相似文献   

12.
案例的检索和提取是案例推理系统的一个关键步骤,案例检索结果的优劣直接影响到案例重用、修改以及整个系统的性能。遗传算法是一种基于进化思想的全局优化方法,但是存在搜索速度慢以及早熟收敛等问题;禁忌搜索是一种局部优化技术,具有搜索速度快等优点。文中将禁忌算法和遗传算法结合在一起提出了一种新的聚类方法,并将该聚类方法引入大型案例推理系统的案例检索过程中。实验结果表明使用这种方法能够达到较理想的搜索效果。  相似文献   

13.
乔丽 《计算机工程》2012,38(6):201-203
在基于K-means的案例检索算法中,目标案例初次映射的失败会导致案例检索成功率降低。针对该问题,提出一种基于滑动窗口的案例检索算法。分析滑动窗口维护策略,利用滑动窗口收集案例库中权重较高且最近常使用的案例,增加案例采样数量。实验结果表明,该算法能提高检索成功率,检索时间较短且案例映射次数较少。  相似文献   

14.
深度学习作为一个新的机器学习方向,被应用到计算机视觉领域上成效显著.为了解决分布式的尺度不变特征转换(Scale-Invariant Feature Transform,SIFT)算法效率低和图像特征提取粗糙问题,提出一种基于深度学习的SIFT图像检索算法.算法思想:在Spark平台上,利用深度卷积神经网络(Convolutional Neural Network,CNN)模型进行SIFT特征抽取,再利用支持向量机(Support Vector Machine,SVM)对图像库进行无监督聚类,然后再利用自适应的图像特征度量来对检索结果进行重排序,以改善用户体验.在Corel图像集上的实验结果显示,与传统SIFT算法相比,基于深度学习的SIFT图像检索算法的查准率和查全率大约提升了30个百分点,检索效率得到了提高,检索结果图像排序也得到了优化.  相似文献   

15.
陈千  向阳  郭鑫  王栋 《计算机科学》2010,37(12):161-164
在基于本体的案例检索系统中,由于数据库中的案例数量随着时间的推移而成倍增加,案例检索的效率不断降低,因此如何有效地提高案例检索系统的效率是个亚待解决的问题。提出一种基于粗糙集的k-means聚类算法,在用户检索之前对案例库中成千上万的案例进行有效聚类,从中定义基于粗糙集的聚类中心和上下近似以及边界。实验证明,该方法在系统检索时不必对每个案例都进行相似度的计算,从而大大提高了检索性能。  相似文献   

16.
视频数据具有一定的隐舍层次性,因此在对视频进行镜头分割后,可以利用模糊聚类算法依据相似度提取关键帧和关键镜头,对视频内容进行抽象概括,并以此时镜头进行检索.本文用非监督学习方法中的在线聚类算法自动提取镜头的关键帧,以相似方法对关键帧进行聚类以自动提取关键镜头,并对分类结果进行自我调整.将上述方法实现并用于镜头检索,获得了良好的检索结果,并减少了经验对聚类的影响,而且较好地表示了视频内容的层次性.  相似文献   

17.
通过分析数据库的数据模型,研究基于内容的多媒体数据库管理系统的构建方法及其功能框架,采用PL/SO.L方式访问Oracle8i数据库。为了提高管理系统的图像检索速度,提出了一种基于内容的图像检索算法,从聚类中心初值选取和分类中心的更新方面改进C-均值聚类算法,较好地解决了图像的分类问题。实验表明:使用该聚类检索算法,能对分类中心进行快速更新,有效地对图像进行聚类以及缩短检索时间,检索性能优于现有的C-均值聚类算法。  相似文献   

18.
In video information retrieval,key frame extraction has been recognized as one of the important research issues.Although much progress has been made,the existing approaches are either computationally expensive or ineffective in capturing salient visual content.In this paper,we first discuss the importance of key frame extraction and then briefly review and evaluate the existing approaches.To overcome the shortcominge of the existing approaches,we introduce a new algorithm for key frame extraction based on unsupervised clustring.Meanwhile,we provide a feedback chain to adjust the granularity of the extraction result.The proposed algorithm is both computationally simple and able to capture the visual content.The efficiency and effectiveness are validated by large amount of real-world videos.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号