首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于等腰归一化距离的模糊粒度空间研究   总被引:1,自引:0,他引:1  
本文将等腰归一化距离引入到模糊商空间中,提出了基于等腰归一化距离的模糊粒度空间理论.研究了它的结构和性质,并得到了四个重要结论.首先,下面3个叙述是等价的(定理3.2): (1) 给定X上的一个模糊等价关系;(2)给定X上的一个等腰归一化距离;(3)给定X上的一个分层递阶结构(或有序的粒度空间).其次,讨论了等腰归一化距离与Fuzzy等价关系间相互确定的对应关系,且都是一对多的关系(定理2.2,定理2.3).最后,给出了通过X上的模糊等价关系R诱导的等腰归一化距离d确定其引导的粒度上的度量dλ,且dλ正好是d在粒度X(λ)上压缩的等腰归一化距离(定理4.1), 同时给出了确定粒度空间上等腰归一化距离的方法.这些研究结论为模糊粒度计算的理论研究和应用提供了强有力的数字模型和工具, 同时表明模糊商空间的粒度计算可以在等腰归一化距离的范畴内进行,为模糊粒度计算提供了更为直观的几何解释.  相似文献   

2.
以1981—1990年我国东北地区繁殖的候鸟野生丹顶鹤为例, 调查其繁殖地分布区域内的月平均气温、月平均最高温度、月平均最低温度、月平均降水和月平均净辐射五个气候因子数据的基础上, 采用分区间统计及基于归一化距离的分层聚类和聚类融合等理论和方法进行相关气候数据的特征分析, 获得丹顶鹤在东北繁殖地的最适宜栖息时间为5~9月份。这一结果与东北地区丹顶鹤的生物学和生态学特征相吻合。与以往文献中用于物种分布预测的气候因子提取方法不同的是, 该方法完全依赖于预测物种在调查分布区内的气候数据, 通过数据挖掘与数据处理而获得, 而不是通过预测物种的生物学与生态学特征及其在分布区内的气候因子相关性分析得到。这一研究方法具有一般性, 将为未来气候变化对候鸟在东北地区栖息地的影响的研究提供基础。  相似文献   

3.
基于信息粒度的聚类分析及其应用   总被引:1,自引:0,他引:1       下载免费PDF全文
在处理复杂问题时,通过改变问题所在的粒度空间,不仅可以有效获取对象的特征,而且可去除干扰和非本质属性,使问题易于分析解决。所谓从粒度计算的观点来讨论聚类分析问题,就是认为聚类是在原问题的粒度下(同一问题的最细粒度空间)进行问题分析。为了简化处理,引入不同的聚类相似性函数,其实质就是得到不同粒度空间的等价类。在实际问题求解中,可以根据问题需要取不同相似性函数,以便将问题变换到所需的粒度空间进行处理。为推广其应用,将该思想应用于车牌二值化,提出了基于信息粒度的聚类变换的二值化算法,实现了从彩色3维空间到黑白1维空间的粒度变换。实验结果表明,该算法所得结果更加切合实际图像,不仅具有普适性,而且有利于下一步的识别操作,尤其对于各种斜车牌、光照不均车牌更具有一定的优越性。  相似文献   

4.
基于商空间的非均匀粒度聚类分析   总被引:4,自引:0,他引:4  
徐峰  张铃 《计算机工程》2005,31(3):26-28,53
采用距离度量空间的手段讨论了商空间的模糊粒度聚类,结合信息融合技术用不同粒度合成聚类结果,认为聚类可以以非均匀粒度来描述样本集。据此提出了使用Gaussian型函数定义商空间的距离函数的模糊聚类算法(FCluster算法),算法用距离表示信息粒度,不需要定义隶属函数和求出相似矩阵,并且不需要讨论参数的选择。仿真实验说明了算法可以很直观地从不同粒度(距离)观察聚类结果,大大降低了计算复杂度和空间复杂度,适于处理大数据量的样本,并且Gaussian型函数定义的距离对试验样本可以达到很好的效果。  相似文献   

5.
现代生产中的大量生产数据蕴藏着丰富的生产过程和质量信息,通过聚类分析可以了解生产状态,进行生产故障诊断或有针对性的质量检测,而经常使用的相似性的度量欧式距离只能反映数据空间分布为球形或超球形的结构特性。难以刻画复杂数据分布特性,将流形距离引入到生产过程状态的聚类分析中,利用标准数据、田纳西—伊斯曼过程和热轧带钢实际生产过程数据对方法的有效性进行验证,进而可以更加有效地了解生产过程的状态。  相似文献   

6.
典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数ddi,dj),对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。  相似文献   

7.
大多数现存的谱聚类方法均使用传统距离度量计算样本之间的相似性, 这样仅仅考虑了两两样本之间的相似性而忽略了周围的近邻信息, 更没有顾及数据的全局性分布结构. 因此, 本文提出一种新的融合欧氏距离和 Kendall Tau距离的谱聚类方法. 该方法通过融合两两样本之间的直接距离以及其周围的近邻信息, 充分利用了不同的相似性度量可以从不同角度抓取数据之间结构信息的优势, 更加全面地反映数据的底层结构信息. 通过与传统聚类算法在UCI标准数据集上的实验结果作比较, 验证了本文的方法可以显著提高聚类效果.  相似文献   

8.
归一化径向基函数网络的结构优化策略   总被引:1,自引:0,他引:1  
针对归一化RBF网络的结构设计,首先利用基于山峰函数的减法聚类算法构造网络的初始结构和初始数值,并采用奇异值分解(SVD)算法分析了网络初始结构中隐含层节点与奇异值,累积贡献率以及索引向量的关系,提出了针对归一化RBF网络的结构精简优化策略。最后,对该结构优化策略的可行性和有效性进行了仿真验证和性能比较。  相似文献   

9.
传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。  相似文献   

10.
基于归一化编辑距离和谱聚类的轨迹模式学习方法   总被引:6,自引:0,他引:6  
针对欧氏距离和Hausdorff距离等在描述目标运动轨迹差异性时度量不够准确的问题,提出一种基于归一化编辑距离和谱聚类的轨迹分布模式学习方法.首先对目标的运动轨迹进行矢量量化编码;然后采用归一化的编辑距离来度量轨迹编码序列之间的差异,得到归一化编辑距离矩阵;再通过该矩阵进行谱聚类来提取轨迹的分布模式;最后利用所提取的轨迹分布模式确定整条轨迹及其局部是否异常.通过仿真和真实场景的实验验证了该方法的有效性.  相似文献   

11.
12.
现有基于混合高斯模型的说话人聚类方法主要依据最大后验准则,从通用背景模型中自适应得到类别的混合高斯模型,然而自适应数据较少,模型的准确性不够。对此,文中尝试基于本征语音(EV)空间和全变化(TV)空间分析的两种因子分析建模方法,通过对差异空间的建模,减少估计类别混合高斯模型时需要估计的参数个数。结果表明,在美国国家标准技术研究所2008年说话人识别评测的电话语音数据集上,相对于基于最大后验概率准则的基线系统而言,文中所使用的基于EV和TV空间分析的建模方法都可使聚类错误率有较大幅度的下降,并且TV空间分析建模相对于EV空间分析建模能获得更低的聚类错误率。  相似文献   

13.
陶华  唐旭清 《计算机科学》2013,40(1):257-261
提出了基于粒度空间的模糊邻近关系聚类结构分析研究,探讨了模糊邻近关系的聚类结构特性。首先,给出粒度空间(或聚类结构)的表示和生成算法,引入关键点序列概念和最小动态连通图诠释模糊邻近关系聚类结构的生成过程;其次,引入模糊邻近关系关于聚类结构的同构和ε-相似的概念,给出了两个模糊邻近关系同构或ε-相似的判定定理;最后,引入模糊邻近关系关于聚类结构的强ε-相似的概念,研究了两个模糊邻近关系同构与强ε-相似之间的关系。这些研究结论为一般的聚类结构分析提供了研究工具。  相似文献   

14.
图结构聚类(SCAN)是一种著名的基于密度的图聚类算法。该算法不仅能够找到图中的聚类结构,而且还能发现图中的Hub节点和离群节点。然而,随着图数据规模越来越大,传统的SCAN算法的复杂度为O(m1.5)(m为图中边的条数),因此很难处理大规模的图数据。为了解决SCAN算法的可扩展性问题,本文提出了一种新颖的基于MapReduce的海量图结构聚类算法MRSCAN。具体地,我们提出了一种计算核心节点,以及两种合并聚类的MapReduce算法。最后,在多个真实的大规模图数据集上进行实验测试,实验结果验证了算法的准确性、有效性,以及可扩展性。  相似文献   

15.
搜索引擎根据特定关键字查询返回的结果,可以基于语义进行分类组织,提高用户查询效率。但分类方法是基于预定义类别的,由于类别不全或更新不及,对于互联网上的信息可能会造成遗漏。本文提出了一种将分类与聚类方法相结合的方法来优化搜索结果,即分类之后,用聚类的方法来处理未被归入任何类别的信息。研究表明,该方法可以兼顾效率和信息完整性。  相似文献   

16.
随着计算机技术的飞速发展,对软件质量的要求也更高了,软件质量度量就是衡量软件品质的一种手段。本文分析了软件质量度量模型,建立了软件质量度量框架,并给出了常用度量方法。  相似文献   

17.
随着计算机技术的飞速发展,对软件质量的要求也更高了,软件质量度量就是衡量软件品质的一种手段。本文分析了软件质量度量模型,建立了软件质量度量框架,并给出了常用度量方法。  相似文献   

18.
受信息抽取工作的驱动,利用事件相关文档的特点,在分析各种文本特征的基础上,综合利用词语、语义和词串信息进行句子相似度计算,并在此基础上进行句子聚类,提出了基于特征选择的句子聚类方法,为抽取事件侧面信息提供更好的基础资源.实验表明,采用多特征后,句子聚类的效果得到明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号