首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
为了提高政府事务管理水平和处理效率,打造“智慧政务”平台,针对政务服务中群众留言的答复内容进行客观评价,提出了一种结合多算法的群众留言回复评价模型.首先,根据答复文本内容定义答复长度、相似性、完整性、可解释性和及时性5个评价特征指标,分别从内容、格式、合理程度和时间4个角度对文本进行评价;其次,采用回归分析方法对答复意见类型进行分析;接着,分别采用K-means聚类、DBSCAN聚类算法、Meanshift聚类算法、HC聚类算法对答复意见等级进行分析,根据4种聚类算法效果对比结果,选用K-means聚类算法,再将聚类算法和回归分析的结果结合,对答复意见进行评价,并将评价等级分为6类.本文模型将机器学习中的数据挖掘和数据分析算法与“智慧政务”相结合,为政府事务管理的研究提供了一个量化分析的工具.  相似文献   

2.
k-means聚类算法中,初始聚类中心的选取与数据中的离群点都对算法的结果有着非常大的影响。针对这一问题,提出一种基于网格和密度的k-means聚类算法GD-k-means,该算法首先将数据集映射到网格上形成网格簇进行初步聚类,利用密度阈值将网格分为低密度网格簇和高密度网格簇,在高密度网格簇中选取初始聚类中心,并利用传统的k-means算法进行迭代,通过评价条件判定是否需要进行网格簇的合并。聚类完成之后按照距离最近的原则对低密度网格簇中的数据进行相应的分配。实验结果表明:GD-k-means算法聚类结果更稳定,并且能够抵抗噪音数据的干扰。  相似文献   

3.
迭代自组织数据分析算法(ISODATA)是一种基于统计模式识别的非监督学习动态聚类算法。针对当前各算法初始聚类数取值困难、容易陷入局部最优等问题,介绍了ISODATA的原理和实现步骤,并将此算法应用于负荷分类中。在MATLAB中结合具体日负荷曲线样本进行聚类分析,结果证明聚类效果较好。将ISODATA与各种传统聚类方法进行了对比实验,比较各种算法的聚类效果、预定聚类数目对算法结果的影响,以及初始聚类中心的选择对结果的影响。对比结果证明,此方法适用于负荷分类的研究。  相似文献   

4.
K-均值(K-means)聚类算法是学术与工业领域的经典算法。然而,它却具有两个明显缺陷:1) 需要预先知道聚类的数量;2) 对算法的随机初始化非常敏感。为了解决这两个问题,首先归纳了K-均值算法的基本步骤,并对聚类有效性进行了分析;然后以数据样本点的欧几里德距离为基础,定义了以聚类数量k为自变量的类间质心距离之和以及类内距离之和,由此构造了聚类有效性评价函数;最后根据经验规则,在聚类数量的可能范围内通过求解聚类有效性评价函数的最小值以确定数据集的最优聚类数量。对UCI的3个数据集Iris、Seeds和Wine的仿真结果说明,提出的聚类有效性评价函数不仅能够准确地反映数据的真实聚类结构,还能有效地抑制算法对随机初始化的敏感性,通过对K-均值算法的多次运行,其结果也验证了聚类有效性评价函数的鲁棒性。  相似文献   

5.
对聚类结果的理解有助于评价聚类效果,可以据此调整聚类过程,更高效地使用聚类结果.但是,聚类结果的理解仍然是一个尚未解决的问题.提出了基于离群点识别技术分析任意聚类算法的聚类结果,发现了聚类结果属性特征簇的方法;提出一种基于不相似性比值的离群点识别算法.通过对全部数据簇的属性描述进行离群点分析,发现各数据簇的特征属性,实现对聚类结果的理解.所提方法适用于任意聚类算法结果的分析.对UCI的iris、ZOO和Housing数据集的采用X-means、Frozen和DBScan算法的聚类结果进行聚类结果分析,实验表明所提方法较成功地发现了不同聚类算法的属性特征簇,有助于对聚类结果的深入理解.  相似文献   

6.
边介数聚类算法在肿瘤基因表达谱中的应用   总被引:1,自引:1,他引:0  
基于肿瘤基因表达谱研究了肿瘤相关基因及其功能模块的聚类算法,同时利用模块度评价了算法的有效性.通过与层次聚类算法的比较,证明边介数聚类算法在肿瘤基因功能模块聚类方面具有一定的有效性和实用性.以人结肠癌基因表达谱为研究对象,应用边介数聚类算法将158个从2万多个原始数据中提取的特征基因聚成7种功能类.通过GO数据库检索进一步证明这7类基因具有明确的生物学功能和意义.  相似文献   

7.
对K-Harmonic Means算法进行扩展,考虑到数据点对不同类的隶属关系,将模糊的概念应用到聚类中,提出了模糊K-Harmonic Means算法,推导出聚类中心和模糊隶属度的迭代公式.在中心迭代聚类算法统一框架的基础上,推导出FKHM算法聚类中心的条件概率表达式以及在迭代过程中的数据加权函数表达式.最后,用Folkes & Mallows指标对聚类结果进行评价.实验表明,模糊K-Harmonic Means(KHM)算法在聚类对于初值不敏感的同时提高了聚类结果的精确度,达到较好的聚类效果.  相似文献   

8.
针对基于核的多视图聚类算法(kernel based multi-view clustering method, MVKKM)在处理大规模数据集时运行时间长的缺点,引入增量聚类模型的概念,将MVKKM算法与增量聚类模型相结合,提出基于核K-means的多视图增量聚类算法(incremental multi-view clustering algorithm based on kernel K-means, IMVCKM)。通过将数据集分块,在每个数据块中使用MVKKM算法聚类,并将每个数据块的聚类中心作为下个数据块的初始聚类中心。将所有块的聚类中心进行整合后再次进行多视图聚类,得到最终的聚类结果。试验结果表明,在3个大规模数据集上,IMVCKM算法相较于MVKKM算法在3个评价指标上具有更好的聚类结果,且运行时间更短。该算法在保证聚类性能的基础上大大降低算法的运行时间。  相似文献   

9.
数据挖掘领域中的聚类方法   总被引:6,自引:0,他引:6  
聚类算法是数据挖掘中的核心技术,随着对聚类算法广泛深入的研究,产生了许多不同的适用于数据挖掘的聚类算法;文章从算法的角度论述了如何在数据挖掘中进行聚类分析,并通过基于评价聚类算法好坏的8个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法.  相似文献   

10.
为了克服模糊聚类算法的不足.提出了一种新的分级混合聚法,利用自组织神经网络对数据初步进行特征提取.再利用基于熵的聚类算法进行聚类。从而既提高了聚类过程的效率,又保证了聚类结果的有效性.  相似文献   

11.
针对化工过程灰箱建模存在的精确度差、速度慢、计算复杂度高等问题,对现行模糊C-均值聚类算法进行了改进,提出了一种快速全局优化的(用于建模的数据训练集)模糊聚类算法.该算法具有不依赖初始条件、收敛速度快等特点.实验结果表明,利用快速全局优化模糊聚类算法得到的数据,在灰色预测的时间和数据准确性方面都有了显著提高,计算机仿真实验表明了该算法的有效性.  相似文献   

12.
本文提出了一种电力系统短期负荷预报的新算法.该算法首先利用模糊技术对历史负荷数据进行平滑处理,建立负荷变化的趋势项和波动项动态模型并作出预报.后利用模糊综合评判的理论对预报值进行调整  相似文献   

13.
杂波环境下雷达组网的多目标聚类融合跟踪   总被引:1,自引:1,他引:0  
多传感器多目标跟踪是信息融合技术在目标跟踪领域的应用范例,数据关联是其中的关键技术之一.对于杂波环境下的组网雷达多目标跟踪,讨论了粗、精关联相结合的数据关联方法.先用基于跟踪门限算法进行粗关联,排除部分杂波,再用模糊C-均值算法模糊聚类来实现关联.通过把多传感器跟踪问题转化为多个单传感器跟踪问题,更有效地实现关联,最后融合量测,滤波后得到目标的状态估计.用该算法对目标进行蒙特卡罗仿真,其比改进前的模糊C-均值关联算法和最近邻域算法在杂波环境下更能有效实现数据关联.  相似文献   

14.
针对液态CO2恒温过程的非线性特点,提出了一种有4输入2输出变量的模糊综合控制算法,并采取一种不用查表的特征展开的简化算法,使在线调整简单,仿真研究证明了方法的可行性.可用8098单片机系统实现。  相似文献   

15.
基于粒子群优化的模糊聚类算法   总被引:9,自引:0,他引:9  
针对模糊C均值聚类算法具有容易陷入局部极小值,对初始值和噪声数据敏感的缺点,提出了基于粒子群优化算法的改进模糊聚类算法(PSFC).该算法引入了粒子群优化算法强大的全局寻优能力,并结合了模糊C-均值聚类算法的特点.实验结果表明,该算法是一种实用的、速度更快、效率更高的改进聚类算法,具有很好的全局收敛性和较快的收敛速度.  相似文献   

16.
针对传统聚类算法难以处理大规模数据和对噪声数据敏感等问题,基于模糊C有序均值聚类算法(FCOM),结合single-pass和online增量架构,分别提出了single-pass模糊C有序均值聚类算法(SPFCOM)和online模糊C有序均值聚类算法(OFCOM).SPFCOM和OFCOM算法首先对FCOM算法加权,然后以数据块为单位对数据集合进行增量式处理.实验结果表明,相较于对比算法,SPFCOM和OFCOM算法在聚类准确率方面得到了提高,还具有更强的鲁棒性.  相似文献   

17.
基于Fuzzy ART的K-最近邻分类改进算法   总被引:4,自引:0,他引:4  
提出了一种K-最近邻改进算法,该算法用模糊自适应共振理论(Fuzzy ART)对K-最近邻的训练样本集进行浓缩,以改善K一最近邻的计算速度.该算法首先用Fuzzy ART将训练样本集中的每一类样本进行聚类,减小了训练样本集的数据量,提高了算法的计算速度,保持了预测精度,从而使该算法适用于海量数据集的情况.实验表明,该算法适用于对复杂而数据量较大的数据库进行分类.  相似文献   

18.
基于特征加权的模糊聚类算法研究   总被引:2,自引:0,他引:2  
模糊聚类分析是非监督模式分类的一个分支,在模式识别中有着重要的地位。在FCM算法中,考虑到样本矢量中各维特征对模式分类的不同影响,本文引入一种基于特征加权的模糊聚类算法,该算法考虑了各维特征对分类的贡献不同,从而对数据进行了更有效的分类。  相似文献   

19.
模糊逻辑技术是人工智能领域中的一个重要分支,针对近年来分类算法的不完善之处提出一种改进的模糊规则库的分类算法,对训练样本各维进行分量聚类,最后生成模糊规则库。通过对Contact-lenses数据集的仿真测试时,算法更加简单易懂,而且分类效果很好.  相似文献   

20.
于泉  荣建 《北京工业大学学报》2007,33(11):1173-1176
引入模糊逻辑模拟高峰时段过饱和交叉口处交通信号控制器的逻辑,基于车辆排队长度给出了绿灯延长时间的模糊逻辑规则,计算出每个入口的有效绿灯时间,使用SimTraffic仿真软件对模糊逻辑的优化过程和传统的定时控制的效果进行对比。本文观测了北京市平乐园交叉路口高峰时段的交通流数据,通过延误指标的计算,基于模糊逻辑的优化方法比传统的定周期配时方法延误减少13.7%,具有较好的控制效果,对过饱和交叉口配时方法具有较好的普及意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号