首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
提出一种针对面向对象软件架构恢复的基于凝聚式信息瓶颈的加权层次聚类算法(ABWHC)。该算法采用信息丢失度作为相似度度量标准,扩充聚类特征和权值,利用面向对象软件的特性,为实体或簇生成用以描述其含义的标签组。实验结果表明,ABWHC算法不仅能改善聚类的性能,还能恢复面向对象软件的架构。  相似文献   

2.
聚类技术可以用于对具有动态、随机和异步并发特性的出租车对象进行分类。但是,现有的聚类技术认为每个出租车样本对聚类的贡献相同,没有考虑到不同样本的不同影响,这在一定程度上影响了聚类的精度。提出了一种基于样本权重的出租车聚集区识别算法--SFTA_IB算法,算法引入了样本权重来充分反映不同样本的贡献度。在此基础上,将出租车视为原变量X,出租车坐标数据视为相关变量Y,目标是寻求压缩变量T,在T中最大化保留相关变量的信息。实验表明,SFTA_IB算法可以准确识别目标样本周边的出租车聚集区,针对性地指导目标出租车个体的巡游线路,提高乘客搜寻效率。  相似文献   

3.
聚类算法在抽取文本数据中的模式结构时,忽略多个语种信息之间潜在的互补作用,得到的模式结构不能充分反映数据的内在信息.针对此问题,文中提出基于并行信息瓶颈的多语种文本聚类算法.首先使用词袋模型为文本数据的不同语种信息构建相应的相关变量.然后将多种相关变量引入并行信息瓶颈方法,通过最大化地保存模式结构与多个相关变量之间的信息,使得到的模式结构能够反映数据的多个语种信息.最后提出基于信息论的抽取合并方法优化文中算法的目标函数,保证其收敛到局部最优解.实验表明,文中算法能有效处理文本数据的多个语种信息,性能优于单语种聚类算法和现有的两类能够处理文本多语种信息的聚类算法.  相似文献   

4.
本文给出了一个无监督图像类别聚类的新方法,该方法基于信息理论原理--信息瓶颈.本聚类方法基于阶段性的分组:首先,对给定文档中的每一张图像应用高斯混合模型,在选定的特征空间中,以一组相连接的区域来表示图像.然后,确保簇和图像内容之间的互信息最大化,对图像进行分组.簇的合适数量可直接由信息瓶颈原理决定.实验结果显示出了该聚类方法在真实图像数据库中的表现.  相似文献   

5.
提出基于信息熵特征选择和信息瓶颈算法的图像聚类算法,首先提取图像的Gabor小波纹理特征和灰度共生矩阵纹理特征,然后采用信息熵特征选择方法进行特征降维;图像聚类方法很多,其中较为典型的k-means聚类算法,但它过分依赖距离函数和聚类中心的选择,采用信息瓶颈算法对图像进行聚类,信息瓶颈算法不需要定义距离函数,它考虑了样本与特征的关系,不仅压缩了样本的信息,同时又考虑保留特征信息。实验结果表明,提出的方法具有良好的聚类效果。  相似文献   

6.
聚类集成是机器学习中的新问题.它是利用同一数据集的多个聚类划分集成在一起,以提高聚类分析的性能.如何发现从多个划分中得到“consensus clustering”是一个很困难的问题.很多学者对此作了研究.本文提出了一种基于互信息的模糊聚类集成算法.该算法主要扩展了Strehl & Ghosh提出的基于互信息的聚类集成目标函数,将其应用到模糊划分的集成,同时利用类似于信息瓶颈聚类的算法进行求解.实验结果表明,在4个UCI的数据集上,基于互信息的聚类集成能获得良好的性能.  相似文献   

7.
针对传统谱聚类算法在路网划分时承载路网信息较少和聚类中心优化问题,提出一种基于改进谱聚类算法的城市路网划分算法.通过转移概率模拟交通路网动态运行特征,利用马尔可夫链对谱聚类相似图进行重构,增强相似图的健壮性,与遗传算法结合,通过遗传算法优化初始聚类中心,提高谱聚类全局寻优能力.实验结果表明,改进后的算法比基准算法具有较...  相似文献   

8.
杨洁 《信息与电脑》2023,(21):173-175
信息智能融合的稳定性较差,容易出现信息融合不准确的状况,因此提出基于模糊聚类的会计预算信息智能融合方法。通过特征值的正负概率计算对特征进行提取,在数据层、特征层和决策层的三个层次划分中,分析会计预算信息融合层次,构建信息智能融合模型,基于模糊聚类实现会计预算信息的智能融合。实验结果表明,实验组能够准确聚类融合信息,可以运用到实际的会计预算信息融合中。  相似文献   

9.
出租车GPS装备的普及使用产生了大量轨迹数据。出租车异常轨迹的检测和分析,可为惩罚具有欺诈行为的出租车司机提供有益支撑。针对出租车稀疏轨迹,基于轨迹相对相似度检测异常轨迹,由于其具有不对称性,类似于DBSCAN的传统密度聚类方法无法适应此种情况,本文提出基于密度RDBSCAN算法用于出租车异常轨迹聚类检测。对于聚类得出的候选异常轨迹,结合轨迹密度异常值和轨迹长度异常值的概念,利用证据理论综合前述2个因素来判别轨迹的异常程度,进而得到异常程度最高的TOP-N异常轨迹。使用旧金山真实的出租车数据,通过提取相同起点和终点(Origin-Destination, OD)的轨迹集进行实验,实验结果表明本文提出的方法能够有效地检测到异常轨迹,并成功给出异常程度最高的TOP-N异常轨迹。  相似文献   

10.
基于用户模式聚类的智能信息推荐算法   总被引:1,自引:0,他引:1  
何波  杨武  张建勋  王越 《计算机工程与设计》2006,27(13):2360-2361,2374
基于数据挖掘的智能信息推荐日益成为一个重要的研究课题。针对现有智能信息推荐算法存在的不足,提出了一种基于用户模式聚类的智能信息推荐算法(IRUMC)。该算法将相似的用户模式聚类到一起,生成用户聚类模式,然后将用户访问操作与用户聚类模式进行匹配,最后形成推荐集。它比较适合新用户、访问站点较少的用户和有新颖性信息需求的用户。实验结果表明,该算法是有效的。  相似文献   

11.
针对数据中多视角模式挖掘的问题,提出一个基于IB方法的无冗余多视角聚类算法:NrMIB.该算法一方面采用IB思想来最大化地保存聚类结果中的信息量,以确保高质量的聚类结果;另一方面通过最小化聚类结果与已知数据划分模式间的互信息来确保新的聚类结果相对于已知划分模式是无冗余的.NrMIB算法既适宜于分析共现数据,又适宜于分析欧氏空间非共现数据,可挖掘出数据中线性及非线性可分模式,无需额外参数来估算欧氏空间的信息量.在人工构造数据模式识别、人脸识别和文档聚类上的实验结果表明,NrMIB算法可有效地挖掘出数据中所蕴含的多个合理划分模式,性能优于传统单视角聚类算法及3个现有的无冗余多视角聚类算法.  相似文献   

12.
在图像处理中,分割算法是其主要研究焦点之一。针对该问题,提出基于信息瓶颈法的新图像分离 合并分割算法。该方法的目的是抽取与输入相关的一个变量的紧密表征,并使得在考虑与输出相关的另一个变量互信息的损失最小。首先,基于一系列图像区域和强度直方图集合之间定义信息渠道,在此渠道中,以互信息的最大化来优化图像分割法;然后,通过最小化互信息损失,完成在上一阶段中获得的多区域合并过程。在二维图像上做的实验表明所提出算法的性能。  相似文献   

13.
图像分割是图像信息处理的内容之一。分割方法有很多,其中较为典型的是模糊C均值(FCM)算法,但它存在一些缺陷。该文提出一种基于信息瓶颈的图像分割方法,用凝聚的信息瓶颈算法对图像像素进行聚类。在分割过程中,使用贝叶斯信息准则确定图像区域的类别数。对一个包含500幅图像的图像库进行实验,结果表明该方法具有很好的分割效果。  相似文献   

14.
出租车服务策略是出租车司机群体智慧的体现,隐藏在大规模的出租车GPS轨迹数据中.基于大数据分析工具,针对出租车GPS轨迹数据进行服务策略挖掘,提取好的服务策略指导司机营运可以提高司机收入和营运效率.乘客搜索策略是出租车服务策略的主要内容,在对GPS轨迹数据进行清洗之后导入HDFS,首先提取司机个人轨迹,并对其收入进行量化,然后对乘客搜索策略建模,根据模型利用hadoop平台统计出司机对各种策略的使用情况,结果表明,收入较高的司机在乘客搜索策略选择上与收入一般的司机有显著差异.  相似文献   

15.
序列化信息瓶颈 (Sequential information bottleneck, sIB) 算法是一种广泛使用的聚类算法。该算法采用联合概率模型表示数据,对样本和属性的相关性有较好的表达能力。但是sIB算法采用的联合概率模型假设数据各个属性对聚类的贡献度相同,从而削弱了聚类效果。本文提出了赋权联合概率模型概念,采用互信息度量属性重要度,并构建赋权联合概率模型来优化数据表示,从而达到突出代表性属性、抑制冗余属性的目的。UCI数据集上的实验表明,基于赋权联合概率模型的WJPM_sIB算法优于sIB算法,在F1评价下,WJPM_sIB算法聚类结果比sIB算法提高了5.90%。  相似文献   

16.
RBAC技术以角色为访问主体,将访问权限与角色相联系,通过给用户分配适合的角色,使角色成为访问控制的主体,可以提高管理的效率。设计了一个基于Web方式的出租车管理信息系统。介绍了基于RBAC的出租车管理信息系统的总体设计、数据库设计及实现。  相似文献   

17.
提出了基于广义信息距离的直接聚类算法.基于信息理论给出了离散量的基本概念,讨论并证明了离散量的一个基本不等式,进而给出了离散增量的概念.在分析距离测度的基础上,提出了广义信息距离(GID)、改进的广义信息距离(IGID),建立了基于GID,IGID的直接聚类算法,并对土地肥力数据资料进行了聚类分析.结果表明,建立的算法与传统的聚类算法相比,算法原理简便、对数据本身的维数与分布要求不高,且具有较好的聚类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号