首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于归一化距离的结构聚类分析   总被引:1,自引:0,他引:1  
在有序粒度空间理论的基础上,提出基于归一化距离的结构聚类(分类)分析理论和方法研究.首先,提出依距离的一致聚类的概念,给出有序粒度空间的结构聚类特征研究.其次,给出基于归一化距离结构聚类分析完整的理论研究,获得基于归一化距离结构聚类的算法.再给出基于粒度空间的最佳聚类问题研究,提出基于粒度空间的、获取最佳聚类的方法,并且这一方法具备全局最优性质.最后,给出基于归一化距离空间的结构聚类的融合技术的研究,即通过两个归一化距离的交运算获取结构聚类融合的研究方法.这些结论为基于距离的结构聚类(分类)提供一整套理论和方法.  相似文献   

2.
基于等腰归一化距离的模糊粒度空间研究   总被引:1,自引:0,他引:1  
本文将等腰归一化距离引入到模糊商空间中,提出了基于等腰归一化距离的模糊粒度空间理论.研究了它的结构和性质,并得到了四个重要结论.首先,下面3个叙述是等价的(定理3.2): (1) 给定X上的一个模糊等价关系;(2)给定X上的一个等腰归一化距离;(3)给定X上的一个分层递阶结构(或有序的粒度空间).其次,讨论了等腰归一化距离与Fuzzy等价关系间相互确定的对应关系,且都是一对多的关系(定理2.2,定理2.3).最后,给出了通过X上的模糊等价关系R诱导的等腰归一化距离d确定其引导的粒度上的度量dλ,且dλ正好是d在粒度X(λ)上压缩的等腰归一化距离(定理4.1), 同时给出了确定粒度空间上等腰归一化距离的方法.这些研究结论为模糊粒度计算的理论研究和应用提供了强有力的数字模型和工具, 同时表明模糊商空间的粒度计算可以在等腰归一化距离的范畴内进行,为模糊粒度计算提供了更为直观的几何解释.  相似文献   

3.
基于模糊商空间的聚类分析方法   总被引:1,自引:0,他引:1  
唐旭清  朱平  程家兴 《软件学报》2008,19(4):861-868
在商空间理论基础上,提出了基于Fuzzy相似关系和归一化距离的聚类分析方法,用以解决复杂系统的数据结构分析问题.得到了如下结论:(1)通过引入基于Fuzzy相似关系和归一化距离的分层递阶结构,建立了严格的聚类分析理论描述;(2)给出了有效的分层递阶结构聚类的快速算法;(3)给出了两个Fuzzy相似关系或由两个归一化距离诱导的Fuzzy相似关系是同构的充分条件.其中所研究的理论和方法适应于建立在相似关系之上的任何复杂系统的数据结构分析.  相似文献   

4.
基于商空间的非均匀粒度聚类分析   总被引:4,自引:0,他引:4  
徐峰  张铃 《计算机工程》2005,31(3):26-28,53
采用距离度量空间的手段讨论了商空间的模糊粒度聚类,结合信息融合技术用不同粒度合成聚类结果,认为聚类可以以非均匀粒度来描述样本集。据此提出了使用Gaussian型函数定义商空间的距离函数的模糊聚类算法(FCluster算法),算法用距离表示信息粒度,不需要定义隶属函数和求出相似矩阵,并且不需要讨论参数的选择。仿真实验说明了算法可以很直观地从不同粒度(距离)观察聚类结果,大大降低了计算复杂度和空间复杂度,适于处理大数据量的样本,并且Gaussian型函数定义的距离对试验样本可以达到很好的效果。  相似文献   

5.
典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数ddi,dj),对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。  相似文献   

6.
赵军  朱荽  杨雯璟  许彦辉  庞宇 《计算机工程》2020,46(2):274-278,285
聚类作为一种有效的图像分割方法,被广泛地应用于计算机视觉领域。相较于其他聚类方法,密度峰值聚类(DPC)具有参数少且能有效识别非球形聚类的特点。基于此,引入信息论中的不确定性度量熵,提出一种改进的DPC图像分割算法。将图像像素点的颜色空间CIE Lab值作为特征数据,通过计算信息熵求得自适应截断距离以取代经验取值,建立相应的决策图并确定聚类中心总数,归类非聚类中心点,剔除噪声点从而完成图像分割。在Berkeley数据集上的实验结果表明,该算法能较好地实现彩色图像的分割,其平均分割时间和PRI指标分别为14.658 s和0.721。  相似文献   

7.
Granular computing serves as a general framework for complex problem solving in broad scopes and at various levels. The granularity was constructed via many ways, however, for complex systems there remain two challenges including determining a reasonable granularity and extracting the hierarchical information. In this paper, a new method is presented for constructing the optimal hierarchical structure based on fuzzy granular space. Firstly, the inter-class deviations and intra-class deviations were introduced, whose properties were investigated in depth and approved mathematically. Secondly, the fuzzy hierarchical evaluation index is developed, followed with a novel model for extracting the global optimal hierarchical structure established. An algorithm is then proposed, which reliably constructs the multi-level structure of complex system. Finally, to reduce the complexity, the granular signatures are extracted according to the nearest-to-center principle; with the use of the signatures, a classifier is designed for verifying our method. The validation of this method is approved by an application to the H1N1 influenza virus system. The theories and methodologies on granular computing presented here are helpful for capturing the structural information of complex system, especially for data mining and knowledge discovery.  相似文献   

8.
In this paper, we present a theoretical framework of fuzzy reasoning model under quotient space structure. It consists of (1) introducing quotient space structure into fuzzy sets, i.e., constructing fuzzy set representations of different grain-size spaces and their relationships; (2) introducing the concept of fuzzy sets into quotient space theory, i.e., introducing fuzzy equivalence relation and discussing its corresponding reasoning in different grain-size spaces; and (3) discussing the relationship and transformation among different granular computing methodologies. The framework proposed is aimed to combine two powerful abilities in order to enhance the efficiency of fuzzy reasoning: one is the ability of computing with words based on fuzzy set methodology, the other is the ability of hierarchical problem solving based on quotient space approach.  相似文献   

9.
基于分层递阶粒度聚类法的空气质量评价   总被引:2,自引:0,他引:2  
针对气候变化与空气质量评价问题,考虑到空气质量数据具有复杂、不确定、不完备、海量高维的特点,提出基于分层递阶商空间的粒度聚类分析法。利用分层递阶模型,通过属性函数对原问题的论域进行划分,获得问题求解的不同层次粒度空间,可以将不确定信息转换成确定性信息,降低问题复杂性,易推广至高维海量数据分析中。宣城市空气质量评价实验结果表明,这种方法能很好地反映该市空气质量的日变化和季节变化,进一步验证了其有效性。  相似文献   

10.
粒度计算研究综述   总被引:29,自引:4,他引:25  
粒度计算GrC(Granular Computing)是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究.它是词计算理论、粗糙集理论、商空间理论、区间计算等的超集,也是软计算科学的一个分支,已成为模糊的、不完整的、不精确的及海量的信息处理的重要工具和人工智能研究领域的热点之一.本文综述了粒度计算的发展动机、研究现状及发展趋势,着重介绍了粒度计算的主要理论模型与方法及其在不同领域的应用,对存在的问题进行了分析,并提出了进一步研究的方向.  相似文献   

11.
为了在只有少量已知标记的数据集中获得较好的聚类效果,提出了一种基于图收缩的半监督聚类算法。首先将整个样本空间中的数据表达为一个带权图,再根据给出的must-link约束,对图进行边收缩的修改,进而增强must-link约束。在此基础上引入图拉普拉斯算子,结合cannot-link约束将样本空间投影到一个特征子空间。最后在子空间上进行聚类分析。实验结果表明,该方法不仅提高了对复杂数据的聚类结果,而且在约束对数量较少时也能获得较好的结果。  相似文献   

12.
基于粗糙粒模型的图像纹理识别和检索   总被引:1,自引:0,他引:1  
传统的纹理识别方法大多是对图像频谱的研究,文中尝试以粒计算理论为基础,利用分层思想对图像的纹理特征进行识别。首先,通过引入粒的边缘和分层熵的概念,建立粗糙粒理论,构造粗糙粒度空间模型。然后,构建基于粒的边缘和分层熵的相似度计算方法,得出一种图像纹理识别方法。该方法不仅提高模型在图像纹理识别上的实用性,而且通过对识别和检索过程的同步进行简化纹理识别的计算过程。最后,仿真实验表明,该模型及所用到的相关方法是可行的,与其它方法相比,该方法识别和检索效果较好。  相似文献   

13.
基于粒度计算的覆盖算法   总被引:1,自引:0,他引:1  
赵姝  张燕  平张铃 《计算机科学》2008,35(3):225-227
为了更好地解决高维海量数据的分类问题,本文提出一种基于粒度计算的覆盖算法.该算法以粒度计算为理论依据,指出在分析研究某一问题时,可以适当将其属性、论域或者结构粗化,求得某个商空间,在该商空间中抓住事物的本质对其研究,对某些在同一个粗粒度世界无法识别或者彼此特征区别很弱的对象可以换一个粒度世界对其分析,从而全面了解整个问题;以构造性学习算法--覆盖算法为具体实现工具,得到多个商空间中的结果,最终由商空间理论中的函数合成法获得完整结果.实验证明这种基于粒度计算的覆盖算法在解决分类问题时是行之有效的.  相似文献   

14.
基于遗传算法的聚类分析   总被引:39,自引:2,他引:39  
给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到便聚类划分效果最好的聚类中心。实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法。  相似文献   

15.
基于矩阵谱分析的文本聚类集成算法   总被引:1,自引:0,他引:1  
聚类集成技术可有效提高单聚类算法的精度和稳定性,其中的关键问题是如何根据不同的聚类成员组合为更好的聚类结果.文中引入谱聚类算法解决文本聚类集成问题,设计基于正则化拉普拉斯矩阵的谱算法(NLM-SA).该算法基于代数变换,通过求解小规模矩阵的特征值和特征向量间接获得正则化拉普拉斯矩阵的特征向量,并用于后续聚类.进一步研究谱聚类算法的关键思想,设计基于超边转移概率矩阵的谱算法(HTMSA).该算法通过求解超边的低维嵌入间接获得文本的低维嵌入,并用于后续K均值算法.在TREC和Reuters文本集上的实验结果验证NLMSA和HTMSA的有效性,它们都获得比其它基于图划分的集成算法更为优越的结果.HTMSA获得的结果比NLMSA略差,而时间和空间需求则比NLMSA低得多.  相似文献   

16.
17.
基于划分的XML文档聚类研究   总被引:1,自引:0,他引:1  
本文在文本聚类的基础上对XML文档聚类进行了研究,对划分聚类法进行了改进,使之适合于XML文档聚类.最后通过路径划分聚类算法根据频繁结构对XML文档进行挖掘聚类,并对实验结果进行讨论.  相似文献   

18.
鉴十在数据学习理论中,基于各种几何正则化的处理方法引起人们的广泛关注,以基于独立成分分析的地震数据处理为背景,针对数据向量的单位模长约束,研究丫单位超球面上的二元聚类问题.通过欧氏诱导度量,推导了单位超球面上的黎曼梯度公式,并据此构造了求取其上二聚类和数据平均的小动点迭代算法.实验结果表明了其有效性和优越性.  相似文献   

19.
As one of the most important techniques in data mining, cluster analysis has attracted more and more attentions in this big data era. Most clustering algorithms have encountered with challenges including cluster centers determination difficulty, low clustering accuracy, uneven clustering efficiency of different data sets and sensible parameter dependence. Aiming at clustering center determination difficulty and parameter dependence, a novel cluster center fast determination clustering algorithm was proposed in this paper. It is supposed that clustering centers are those data points with higher density and larger distance from other data points of higher density. Normal distribution curves are designed to fit the density distribution curve of density distance product. And the singular points outside the confidence interval by setting the confidence interval are proved to be clustering centers by theory analysis and simulations. Finally, according to these clustering centers, a time scan clustering is designed for the rest of the points by density to complete the clustering. Density radius is a sensible parameter in calculating density for each data point, mountain climbing algorithm is thus used to realize self-adaptive density radius. Abundant typical benchmark data sets are testified to evaluate the performance of the brought up algorithms compared with other clustering algorithms in both aspects of clustering quality and time complexity.  相似文献   

20.
随着近几年我国经济的不断发展,其数据量也越来越大,大数据的出现使得数据挖掘技术得到了广泛重视,而聚类分析作为数据挖掘的核心的也越来越受到关注。本文主要介绍聚类分析的具体含义,并分析聚类分析的种类以及聚类分析进行划分时其簇的类型来对聚类分析算法进行详细描述,并通过聚类算法在实践中的应用,为数据挖掘在具体实践中的应用提供依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号