共查询到20条相似文献,搜索用时 78 毫秒
1.
现有的多视图聚类算法往往缺乏对各视图可靠度的评估和对视图进行加权的能力,而一些具备视图加权的多视图聚类算法则通常依赖于特定目标函数的迭代优化,其目标函数的适用性及部分敏感超参数调优的合理性均对实际应用有显著影响。针对这些问题,提出一种基于视图互信息加权的多视图集成聚类(MEC-VMIW)算法,主要过程可分为两个阶段,即视图互加权阶段与多视图集成聚类阶段。在视图互信息加权阶段,对数据集进行多次随机降采样,以降低评估加权过程的问题规模,进而构建多视图降采样聚类集合,根据不同视图的聚类结果之间的多轮互评得到视图可靠度评估,并据此对视图进行加权;在多视图集成聚类阶段,对各个视图数据构建基聚类集合,并将多个基聚类集合加权建模至二部图结构,利用高效二部图分割算法得到最终多视图聚类结果。在若干个多视图数据集上的实验结果验证了所提出的多视图集成聚类算法的鲁棒聚类性能。 相似文献
2.
提出一种基于Bagging的集成聚类方法,采用一种新的数据集采样技术生成数据子集,尽可能的保持了子样本的多样性和最大相关性,然后应用一种改进的k均值聚类算法生成个体学习器,根据互信息对数据集的不同聚类结果进行处理,最后通过计算有争议的数据对象与各个聚类中心的距离将其重新划分到新的聚类结果中.在多个UCI标准数据集上的实验结果表明,该方法能有效改善聚类质量. 相似文献
3.
4.
当前流行的聚类集成算法无法依据不同数据集的不同特点给出恰当的处理方案,为此提出一种新的基于数据集特点的增强聚类集成算法,该算法由基聚类器的生成、基聚类器的选择与共识函数构成。该算法依据数据集的特点,通过启发式方法,选出合适的基聚类器,构建最终的基聚类器集合,并产生最终聚类结果。实验中,对ecoli,leukaemia与Vehicle三个基准数据集进行了聚类,所提出算法的聚类误差分别是0.014,0.489,0.479,同基于Bagging的结构化集成(BSEA)、异构聚类集成(HCE)和基于聚类的集成分类(COEC)算法相比,所提出算法的聚类误差始终最低;而在增加候基聚类器的情况下,所提出算法的标准化互信息(NMI)值始终高于对比算法。实验结果表明,同对比的聚类集成算法相比,所提出算法的聚类精度最高,可伸缩性最强。 相似文献
5.
为改进SVM对不均衡数据的分类性能,提出一种基于拆分集成的不均衡数据分类算法,该算法对多数类样本依据类别之间的比例通过聚类划分为多个子集,各子集分别与少数类合并成多个训练子集,通过对各训练子集进行学习获得多个分类器,利用WE集成分类器方法对多个分类器进行集成,获得最终分类器,以此改进在不均衡数据下的分类性能.在UCI数据集上的实验结果表明,该算法的有效性,特别是对少数类样本的分类性能. 相似文献
6.
聚类集成使用合适的策略融合多个具有差异性的基聚类成员,能够有效提高聚类结果的稳定性、鲁棒性和准确率。当前聚类集成的研究较少利用已知的先验信息,面对复杂数据时难以刻画对象与类簇之间明确的归属关系。因此,提出一种基于Seeds集和成对约束的半监督三支聚类集成方法。首先,基于已有的标签信息提出一种新的三支标签传播算法构造基聚类成员;其次,提出一种半监督三支聚类集成框架集成基聚类成员,构造出一致性相似矩阵,并利用成对约束信息对该矩阵进行优化调整;最后,将三支谱聚类作为一致性函数对相似矩阵进行聚类,得到最终集成结果。在多个UCI真实数据集上的实验结果表明,与基于类簇的相似分区算法(CSPA)、超图分区算法(HGPA)、元类簇算法(MCLA)、标签传播算法(LPA)、Cop-Kmeans等半监督聚类集成算法相比,所提方法的归一化互信息(NMI)、调整兰德系数(ARI)和F测度在绝大多数据集上取得了最优值,获得了相对更好的聚类集成结果。 相似文献
7.
现有多视图模糊C均值聚类(FCM)算法通常将一个多视图分解为多个单视图进行数据处理,导致视图数据聚类精度降低,从而影响全局数据划分结果。为实现高维数据和多视图数据的高效聚类,提出一种基于KL信息的多视图自加权模糊聚类算法。将多个视图信息及其权重进行拟合融入标准FCM算法,求解多个隶属度矩阵和质心矩阵。在此基础上,通过附加KL信息作为模糊正则项进一步修正共识隶属度矩阵并保持权重分布的平滑性,其中KL信息是视图隶属度与其共识隶属度的比值,最小化KL信息会使每个视图的隶属度偏向于共识隶属度以得到更好的聚类结果。实验结果表明,该算法相比于传统聚类算法具有更好的聚类效果和更快的收敛速度,尤其在3-Sources数据集上相比于MVASM算法的聚类精度、标准化互信息和纯度分别提升了7.46、15.34和5.48个百分点。 相似文献
8.
针对多视角聚类任务如何更好地实现视角间的合作之挑战, 提出一种新的视角融合策略. 该策略首先为每个视角设置一个划分, 然后通过自适应学习获取一个融合权重矩阵对每个视角的划分进行自适应融合, 最终利用视角集成方法得到全局划分结果. 将上述策略应用到经典的FCM(Fuzzy ??-means) 模糊聚类框架, 提出相应的多视角模糊聚类算法. 在模拟数据集和UCI 数据集上的实验结果均显示, 所提出的算法较几种相关聚类算法在应对多视角聚类任务时具有更好的适应性和更好的聚类性能.
相似文献9.
10.
针对密度峰值快速聚类(CFSFDP)算法对不同数据集聚类效果的差异,利用谱聚类对密度峰值快速聚类算法加以改进,提出了一种基于谱分析的密度峰值快速聚类算法CFSFDP-SA。首先,将高维非线性的数据集映射到低维子空间上实现降维处理,将聚类问题转化为图的最优划分问题以增强算法对数据全局结构的适应性;然后,利用CFSFDP算法对处理后的数据集进行聚类。结合这两种聚类算法各自的优势,能进一步提升聚类算法的性能。在5个人工合成数据集(2个线性数据集和3个非线性数据集)与4个UCI数据库中真实数据集上的聚类结果显示,相比CFSFDP算法,CFSFDP-SA算法的聚类精度有一定提升,在高维数据集的聚类精度上最多提高了14%,对原始数据集的适应性更强。 相似文献
11.
韩建林 《数字社区&智能家居》2006,(17)
以当前信息化社会环境为基点,概括了信息素养的基本定义,讨论了高校学生的信息素养含义,并从信息意识素养、信息伦理道德素养、信息处理能力素养、信息交流共享能力素养四个方面论述了高校学生应具备的信息素养结构。 相似文献
12.
Brian Detlor 《Information Systems Journal》2003,13(2):113-132
Abstract. This case study investigates various ways in which different internet-based information systems (IS) are used by organizational participants. Borrowing theoretical insights on information behaviour accumulated over 50 years of information studies research, a conceptual framework is presented to help understand and assess the social and organizational impacts of internet-based IS. The framework describes the use of internet-based IS as a dynamic cycle of information needs–seeking–use activity situated in the context of a firm's information environment. Research questions pertain to the process of how individuals in organizations seek and use information from internet-based IS to satisfy information needs. In terms of information needs, this involves understanding the problem situations that lead participants to use internet-based IS, as well as the characteristics of those problems beyond subject matter. With respect to information seeking, this involves analysing how information from internet-based systems is displayed and formatted to signal their potential usefulness. In terms of information use, this involves how information obtained from internet-based systems is used in practice to resolve or redefine problems. Both quantitative and qualitative research methods are used. Data collection involves web tracking to identify significant episodes of internet-based IS activity, as well as one-on-one interviews to explore the context behind these episodes. Results suggest that it is possible and valuable to identify scenarios of internet-based IS use dominant in an organizational work setting. Doing so can help to identify ways to improve the situated use of internet-based IS that ameliorate the information needs–seeking–use cycle in firms. 相似文献
13.
韩建林 《数字社区&智能家居》2006,(6):212-213
以当前信息化社会环境为基点,概括了信息素养的基本定义,讨论了高校学生的信息素养含义,并从信息意识素养、信息伦理道德素养、信息处理能力素养、信息交流共享能力素养四个方面论述了高校学生应具备的信息素养结构。 相似文献
14.
军队信息化建设发展日益深入,军队院校学员是未来军队信息化建设的中坚和骨干,学习运用信息化的程度,直接关系部队信息化建设的成效。介绍了信息素质的内涵,提出了培养学员信息素质的具体方法与措施。 相似文献
15.
计算机中的信息系统包括数据库、数据库运行、数据库的存放和传输等部分。为了保证信息的完整性及安全性,本文探究了威胁信息来源、信息流向、信息的执行及保存方面的因素,并且针对不同的信息威胁因素提出了解决威胁问题的方法。 相似文献
16.
为满足用户广泛、准确、快速获取文物信息的要求,设计了数字博物馆文物信息获取系统。在设计过程中采用多线程、信息再过滤、信息重新分类等技术,对信息获取、信息分析、信息分类技术进行改进,解决了目前数字博物馆存在的信息来源局限性的问题,同时提高信息的准确性,使文物信息分类清晰,从而实现了文物信息的快速检索。 相似文献
17.
18.
章仁忠 《计算机与数字工程》2006,34(4):105-108
论述了企业信息化建设的现状及发展情况。文章首先介绍了企业信息化建设取得的初步成效,分析了企业信息化建设值得注意的几个问题,最后提出了加快企业信息化建设的对策措施。 相似文献
19.
20.
实现信息化管理是当前企业发展的必然要求,而信息化管理的实施则依赖于企业信息安全建设的发展程度。本文从设计院数据应用的实际需求出发,提出了信息安全管理制度建设的基本原则,并给出了保障信息安全的相关技术手段。科学完善的管理制度与相关技术手段相结合的管理模式较好地解决了企业信息安全的保障问题。 相似文献