共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
3.
网络信息检索是人们获得信息的重要途径.聚类很早就被应用到网络信息检索当中,但是因为聚类算法本身的一些缺点,聚类并没有在主流搜索引擎中广泛被应用.结合聚类算法的特点论证了聚类在网络信息检索中可以起到辅助的作用. 相似文献
4.
基于层次的聚类方法是聚类分析算法的基本方法之一,但是由于其自身的缺点(如:合并后不能撤消等)往往会导致聚类质量不高。文中通过将一种改进的遗传算法用于聚类分析中,实现了层次聚类,并通过改进遗传算法参数,以提高算法的性能,这样既改善了基本遗传算法收敛慢、易陷入局部最优解的问题,同时又加快了聚类速度,减小误差。 相似文献
5.
基于模糊聚类分析的数据检索的应用 总被引:7,自引:4,他引:3
为提高数据检索的效率,文章提出了一种将模糊聚类分析应用到数据检索中的方法。该方法以一种兼容值贴近和形贴近的新统计量——相似度为基础,采用凝聚的层次聚类方法对数据进行聚类,然后将聚类结果形成一个聚类中心文件,通过计算比较聚类中心和查询数据的相似程度来进行聚类检索。 相似文献
6.
文中基于使传统聚类算法能够满足当前大数据分析的对计算效率的需求,采用将传统聚类算法分布式化的方法提高传统聚类算法效率。结合近年来广泛使用的Map Reduce分布式处理模型,对K-means、PAM、CLARA 3种算法进行了分布式化实验,并从数据规模和节点数量两个方面考察、讨论了一些影响并行算法性能的因素。实验分析表明,该方法能够有效地将聚类方法并行化,并可以应用在分布式系统当中。 相似文献
7.
8.
现代电磁环境下,电磁防护日益显得重要,通过反电子侦察技术,以对抗电子侦察对电磁信息安全构成的威胁。针对此问题进行了探讨,从雷达侦察信号处理着手,考虑一种不太依赖于接收机对象信息,对侦察接收机的位置与工作状态不敏感的抗迭代自组织数据分析算法(ISODATA)聚类方法,实现对辐射源侦察的对抗。仿真表明,该算法可以有效破坏对雷达侦察信号处理的正确分选过程,使其获得错误和虚假的辐射源电磁特征参数信息,从而实现电磁防护。 相似文献
9.
10.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高. 相似文献
11.
Qi Haoliang Li Mu* Gao Jianfeng** Li Sheng 《电子科学学刊(英文版)》2006,23(6):933-936
I. Introduction Most of current Information Retrieval (IR) sys-tems try to match terms of queries with terms of documents. One major problem of these approaches lies in that users want to retrieve documents accord-ing to content, while individual words provide unre-liable evidence about the content of the texts[1?3]. When some parts of text in the document collection are missing, e.g. only the abstract is available, the word-use variability problem will have substantial impact on the IR per… 相似文献
12.
13.
14.
Since webpage classification is different from traditional text classification with its irregular words and phrases, massive and unlabeled features, which makes it harder for us to obtain effective feature. To cope with this problem, we propose two scenarios to extract meaningful strings based on document clustering and term clustering with multi-strategies to optimize a Vector Space Model (VSM) in order to improve webpage classification. The results show that document clustering work better than term clustering in coping with document content. However, a better overall performance is obtained by spectral clustering with document clustering. Moreover, owing to image existing in a same webpage with document content, the proposed method is also applied to extract image meaningful terms, and experiment results also show its effectiveness in improving webpage classification. 相似文献
15.
Clustering is the main method of deinterleaving of radar pulse using multi-parameter. However, the problem in clustering of radar pulses lies in finding the right number of clusters. To solve this problem, a method is proposed based on Self-Organizing Feature Maps (SOFM) and Composed Density between and within clusters (CDbw). This method firstly extracts the feature of Direction Of Arrival (DOA) data by SOFM using the characteristic of DOA parameter, and then cluster of SOFM. Through computing the cluster validity index CDbw, the right number of clusters is found. The results of simulation show that the method is effective in sorting the data of DOA. 相似文献
16.
近红外光谱技术在纺织布料聚类分析中的应用 总被引:2,自引:1,他引:2
以棉涤、棉氨、粘涤、棉锦、羊腈、锦涤六种纺织布料为研究对象,采集近红外光谱数据,进行一阶求导和矢量归一化预处理后,采用标准算法计算样品间的光谱距离,并利用Ward氏算法对样品进行聚类分析.试验对三种、四种、五种布料分别进行了聚类,所有不同种类的样品都得到了正确的分类,验证了近红外光谱检测法应用于纺织品聚类分析中的可行性.通过对聚类算法的分析,提出了局部回归算法在纺织品聚类分析中的应用,为进一步研究近红外光谱技术在纺织布料聚类分析中的应用提供了建议. 相似文献
17.
18.
针对传统共词聚类分析法中共词矩阵构建不能全面反映主题词之间的关联问题,提出了基于高频主题词共现于同一篇文献多种格式内容构建共词矩阵的方法,针对传统聚类算法对于类团非球状且类团大小相异较大导致聚类效果不理想等问题,利用改进的CRUE聚类算法对共词矩阵聚类。并对PubMed中肺癌领域相关文献进行共词聚类分析,实验论证了改进后共词聚类分析方法的可行性。 相似文献
19.
20.
基于互补空间信息的多目标进化聚类图像分割 总被引:1,自引:0,他引:1
现有的多目标进化聚类算法应用于图像分割时,没有考虑图像的任何空间信息,使得该类算法在含噪图像上的分割性能不理想。该文鉴于图像的局部空间信息和非局部空间信息的互补性,试图将这两种空间信息同时引入到聚类有效性函数中,构造了融合互补空间信息的目标函数,进而提出了应用于图像分割的基于互补空间信息的多目标进化聚类算法。该算法采用染色体可变长编码策略在进化过程中自动确定图像分割数目,减少了人为干预。自然图像的分割实验表明,该算法不但能在含噪图像上取得较为满意的分割性能,而且适用于多种类型的含噪图像。 相似文献