首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 390 毫秒
1.
彭昂  王如龙  陈泉泉  张锦 《计算机应用》2010,30(7):1930-1932
针对电信客户的有效细分问题,利用属性相似度度量思想,提出了一种面向复杂属性的聚类算法。该算法用复杂属性分布相似度函数衡量对象的相似性,然后根据相似性建立图模型,最后对图进行分割进行聚类。相比于传统基于选维和降维的聚类分析算法,提出的算法能有效处理高维数据和复杂属性。同时,算法在参数调节时,不需遍历原始数据,也减少了人工干预。利用真实电信客户数据进行的模拟实验也表明,提出的算法具有良好性能,可以有效解决电信客户细分问题。  相似文献   

2.
现有的数据流聚类算法大都只能处理单一数值属性的数据,不能应对同时包含数值属性与分类属性特征的数据,且已存在的混合属性数据流聚类算法在对数据的标准化处理和聚类上还有很大的改进之处,为此,提出二重k近邻混合属性数据流聚类算法.该算法采用CluStream算法的在线、离线框架,并提出了混合属性数据流下三步聚类的思想.算法先运用二重k近邻和改进的维度距离生成微聚类,然后利用动态标准化数据方法和基于均值的余弦模型生成初始宏聚类,最后利用基于均值的余弦模型和先验聚类结果进行宏聚类优化.实验结果表明,所提出的算法具有良好的聚类质量及可扩展性.  相似文献   

3.
角色分析可以满足产品个性化设计系统中对于用户模型构建的需要。提出了基于粗集的模糊聚类角色分析与模型构建方法,通过构造基于粗集的模糊相似矩阵、确定角色属性的模糊相似聚类分析方法,从用户调研数据中提取典型用户属性特征,构建角色模型。该方法完善了角色分析在产品设计中的应用方法,有助于快速生成概念产品设计模型与方案。  相似文献   

4.
在实际生活中,信息系统的增量数据会不断产生,如何充分利用以前计算的结果结合新产生的数据进行新的知识发现,这是有意义的。针对这样的问题,提出了基于权得联系度的粗集模型,它着重考虑了条件属性重要性存在差异来建立粗集模型,而条件属性重要性可以通过以前数据的知识发现计算出来,于是利用基于权重联系度的粗集模型在对新产生的数据进行知识发现时,利用了以前的数据信息。建立了基于权重联系度的粗集模型及其对应的属性和属性值约简理论,最后通过一个示例来演示增量式知识发现的方法。  相似文献   

5.
李克潮  凌霄娥 《计算机应用》2013,33(10):2804-2806
针对传统推荐系统数据稀疏、相似性计算方法导致共同评分用户少的问题,提出利用云模型定性概念与定量数值转换的优势,研究云模型、用户聚类的个性化推荐改进算法。用户对项目属性评价的偏好,转换为用户对加权综合云模型表示的数字特征的偏好。利用改进的聚类算法,对评分数据、原始用户属性标准化后的信息进行聚类;同时考虑用户兴趣的变化,结合用户之间项目属性评价的综合云模型的相似度、用户对项目评分的聚类、用户属性聚类这三种方法产生的邻居用户的并集进行推荐。理论分析和实验结果表明,提出的改进算法不但解决数据稀疏性带来的共同评分用户少的弊端,即使是在新用户的情况下,仍能获得较低的平均绝对误差和平均平方误差  相似文献   

6.
通过定义子空间结构化低秩正则项,将其与子空间结构化稀疏子空间聚类模型相结合,给出一个新的统一优化模型。新模型利用数据的类别属性和相似度互相引导,使得相似度具有判别性和一致性,类别属性具有一致性。相似度的判别性有利于将不同子空间的数据分为不同类,而一致性有利于将同一子空间的数据聚为一类。大量实验表明提出的方法优于一些典型的两步法和子空间结构化稀疏子空间聚类模型。  相似文献   

7.
为了提升分类数据聚类集成的效果,提出了一种新的相关随机子空间聚类集成模型。该模型利用粗糙集理论将分类属性分解成相关和不相关子集,在相关属性子集上随机生成多个相关子空间并对分类数据进行聚类,通过集成多个较优且具差异性的聚类结果以获得最终的聚类划分。此外,将粗糙集约简概念应用于相关子空间属性数目的确定,有效地避免了参数对聚类结果的影响。UCI数据集实验表明,新模型的性能优于其他已有模型,说明了其有效性。  相似文献   

8.
为了防止数据敏感属性的泄露,需要对数据敏感属性进行匿名保护。针对l-多样性模型当前已提出的算法大多是建立在概念层次结构的基础上,该方法会导致不必要的信息损失。为此,将基于属性泛化层次距离KACA算法中的距离度量方法与聚类结合,提出了一种基于聚类的数据敏感属性匿名保护算法。该算法按照l-多样性模型的要求对数据集进行聚类。实验结果表明,该算法既能对数据中的敏感属性值进行匿名保护,又能降低信息的损失程度。  相似文献   

9.
在知识发现和数据挖掘领域,粗集理论与模糊集合理论都是研究信息系统中知识不完备、不准确问题,两者都可利用观测数据表达知识,进行推理。论文针对传统粗集环境下知识表示模型用固定的属性及属性值来描述对象这一局限,提出利用模糊属性模型对知识表达系统进行信息描述,并给出了模糊属性集的粗糙上下近似模型。  相似文献   

10.
研究电信客户流失问题,电信客户流失数据具有模糊性和非线性,单一算法仅能对模糊性或非线性进行预测,为提高电信客户流失估计准确率,提出了一种电信客户流失组合估计模型.首先对客户属性进行清洗并进行离散化处理,接着使用粗糙集方法对离散属性进行约简,刻画电信客户流失数据的模糊性;然后遗传算法优化支持向量机对电信客流失非线性进行描述,建立电信客户流失估计模型.仿真结果表明,粗糙集与支持向量机相融合模型克服单一粗糙集算法或支持向量机存在的缺陷,提高电信客户流失估计模型的估计准确率,可为电信客户管理优化设计提供依据.  相似文献   

11.
针对径向基概率神经网络故障诊断输入量过多会影响网络学习效率的问题,提出了一种基于粗糙集的概率神经网络故障诊断优化方法.该方法用模糊C均值聚类将故障诊断训练数据离散化,使用粗糙集化简由输入输出属性构成的决策表,利用约简后的输入量重新构建神经网络故障诊断模型,使原有模型得到优化并以柴油机故障诊断为例说明该方法的有效性.  相似文献   

12.
Based on bottom-up fuzzy rough data analysis, a new rough neural network decision-making model is proposed. Through supervised Gaustafason–Kessel (G–K) clustering algorithm, proper fuzzy clusters are found to partition the input data space. At the same time cluster number is searched by monotone increasing process. If the cluster number matches with that exactly exist in data sets then excellent fuzzy rough data modeling (FRDM) model can be built. And by integrating it with neural network technique, corresponding rough neural network is constructed. Our method overcomes the defects of conventional top-down based rough logic neural network (RLNN) method, and it also achieves adaptive learning ability and comprehensive soft decision-making ability compared with FRDM model. The experiment results indicate that our method has stronger generalization ability and more compact network structure than conventional RLNN.  相似文献   

13.
针对粗集神经网络构建过程中的论域空间划分问题,提出一种基于模糊聚类的论域划分方法。将带交叉变异算子的粒子群优化算法(PSO)与模糊C-均值聚类算法(FCM)相结合,给出一种新的模糊聚类算法CMPSO-FCM,该算法具有良好的搜索能力和聚类效果。提出一种基于信息熵的模糊粗糙集决策规则获取方法,并用获取的规则指导粗集神经网络的构建。实验结果表明,该方法构造的神经网络具有更精简的结构、较好的分类精度和泛化能力。  相似文献   

14.
基于粗糙集的混合属性数据聚类算法   总被引:2,自引:0,他引:2  
范黎林  王娟 《计算机应用》2010,30(12):3377-3379
传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法,利用粗糙集理论将数据对象划分到一个簇的上近似集或下近似集当中,提供了一种新的处理不确定性的视角,很好地解决了这种边界不确定问题。但其缺点是不能处理混合属性数据,聚类结果对初值有明显的依赖性。针对这些算法存在的不足,给出了一种适用于混合属性数据的距离定义,对初始值的选取提出了改进办法,提出了一种基于粗糙集的混合属性数据聚类算法。仿真实验证明,在不确定聚类簇数的情况下,该算法的聚类准确率比传统k-means算法明显提高。  相似文献   

15.
神经网络是智能故障诊断系统的一种重要的方法。粗糙集理论则是处理不完备信息的一种技术。文中以复杂的人工智能诊断问题为研究对象,系统地论述了基于神经网络、粗糙集、信息融合的智能诊断的理论、方法与实践。其主要方法如下:在故障诊断的神经网络模型的基础上,以粗糙集理论中的信息系统属性值表为主要工具,将复杂的组合神经网络约简并删除其中不必要的属性,克服了网络规模过于庞大和分类速度慢的缺点,并给出了基于粗糙集理论的组合神经网络的模型结构,最后再利用数据融合技术,得出更加精确的结果。一个故障诊断实例证明了该方法的有效性。  相似文献   

16.
针对粗糙聚类算法缺乏对数据比例变换的鲁棒性的问题,在粗糙聚类的框架下融合模糊聚类的思想,将临界区域中对象的模糊隶属度作为它们对于聚类中心调整的作用权值,得到一种带有模糊权的粗糙聚类算法(fuzzy weighing rough clustering algorithm, FWRCA).实验表明,该算法不仅对于数据的比例变化具有鲁棒性,且在一定程度上克服了粗糙C均值聚类算法对划分阈值ε的敏感性,在性能上优于传统粗糙C均值聚类算法(如RCMCA),可应用于水电工程科学等以原型模型为研究手段并有大量需做比例变换的观测数据的领域.  相似文献   

17.
Clustering categorical data arising as an important problem of data mining has recently attracted much attention. In this paper, the problem of unsupervised dimensionality reduction for categorical data is first studied. Based on the theory of rough sets, the attributes of categorical data are decomposed into a number of rough subspaces. A novel clustering ensemble algorithm based on rough subspaces is then proposed to deal with categorical data. The algorithm employs some of rough subspaces with high quality to cluster the data and yields a robust and stable solution by exploiting the resulting partitions. We also introduce a cluster index to evaluate the solution of clustering algorithm for categorical data. Experimental results for selected UCI data sets show that the proposed method produces better results than those obtained by other methods when being evaluated in terms of cluster validity indexes.  相似文献   

18.
在研究TMN和数据集成的基础上,提出一个基于TMN标准的电信网管数据集成模型,解决了本电信网管系统中由于多厂商、多制式、多版本的交换机数据管理的难题。实现了不同交换机网管数据集成的即插即用。  相似文献   

19.
基于关联规则的通信网络告警相关性分析模型   总被引:4,自引:0,他引:4  
在通信网络运行过程中.每天都会产生大量告警,将数据挖掘中的关联规则发现技术用于分析历史告警数据,可发现告警相关性规则。这些规则可辅助故障定位和告警过滤,以减轻网络管理员的工作强度,提高工作效率。本文分析了通信网络原始告警信息的特点,提出了一个基于关联规则的通信网络告警相关性分析模型,该模型通遏对原始告警数据进行预处理,不仅有效地解决了网络告警时间不同步问题,使得处理后的告警数据可直接用一般的关联规则挖掘工具发现告警相关规则,还大大地压缩了挖掘结果,提高了规则的准确率。初步的实验表明这种分析模型具有实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号