首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
王磊 《计算机应用》2020,40(7):1996-2002
面对日益复杂的网络环境,传统入侵检测方法误报率高、检测效率低,且存在优化过程中准确性和可解释性相互矛盾等问题,因此提出一种结合改进粗糙集属性约简和K-means聚类的网络入侵检测(IRSAR-KCANID)方法。首先基于模糊粗糙集属性约简对数据集进行预处理,优化异常的入侵检测特征;再利用改进K-means聚类算法估计入侵范围阈值,并对网络特征进行分类;然后根据用于特征优化的线性规范相关性,从所选择的最优特征探索特征关联影响尺度以形成特征关联影响量表,完成对异常网络入侵的检测。实验结果表明,特征优化聚类后的最小化测量特征关联影响量表能在保证最大预测精度的前提下,最小化入侵检测过程的复杂度并缩短完成时间。  相似文献   

2.
基于相对距离的改进粗K-means方法   总被引:1,自引:0,他引:1  
王明春  唐万生  江琪  刘鑫 《计算机应用》2009,29(4):1102-1105
对现有的两种基于绝对距离的粗K-means方法进行了讨论,指出了各自的不足之处。在此基础之上,讨论了用相对距离替代绝对距离的合理性,从而给出了基于相对距离的粗K-means方法。通过对随机数据、Iris数据和文本数据进行聚类效果比较,验证了基于相对距离的粗K-means方法的可行性和有效性。  相似文献   

3.
根据话题检测任务的定义和特点,本文分析了传统的增量聚类算法和K-means算法的优缺点,提出了基于话题检测的自适应增量K-means算法,设计了话题检测实验,实验结果证明了该算法提高了话题检测性能,具有良好的应用前景。  相似文献   

4.
新的K-均值算法最佳聚类数确定方法   总被引:8,自引:0,他引:8       下载免费PDF全文
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。  相似文献   

5.
一种有效的K-means聚类中心初始化方法*   总被引:5,自引:0,他引:5  
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means 算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。  相似文献   

6.
针对脑部磁共振图像(M RI)的灰度分布特性,提出一种结合灰度距离加权K‐means聚类与模糊置信度的混合医学图像分割方法。采用改进的灰度加权K‐means聚类方法对M RI图像进行训练分类得到粗略分类结果,运用基于支持向量数据域描述(SVDD)的模糊置信度方法对每个类精细分割,得到脑部各组织的输出图像。该算法分割时逐渐增大目标模糊置信度门限,通过对模糊置信度的动态优化来逼近最佳分割结果。在脑部M RI图像上的实验结果表明,该方法在处理图像灰度分布不均匀、存在孤立点、细化轮廓等问题时具有较高的准确度和鲁棒性。  相似文献   

7.
K-means算法是一种基于划分的聚类算法,具有算法简单且收敛速度快的特点。但该算法的性能依赖于聚类中心的初始位置的选择。拓展了复杂网络的重要特征,针对带有属性的数据对象所构成的数据集,定义了多维属性对象的度、聚集度和聚集系数,选取度和聚集系数高的K个点作为K-means聚类的初始中心点。实验数据表明,改进后的K-means算法较传统的算法具有更高的效率和准确度。  相似文献   

8.
在日益激烈的市场竞争环境下,企业往往会选择研发合作以降低研发的成本和风险,而纵向研发合作已成为其中的重要模式。构建了一个存在两个上游企业和多个下游企业所组成的复杂双层市场结构,对上下游企业实施纵向研发合作的产量变化和利润变化进行了分析,在此基础上探讨了研发合作的最优研发绩效。研究了纵向研发合作下利润匹配型和固定比例型两种分担机制的分担系数和净利润等经济指标,得出了一些符合现实经济活动的结论。  相似文献   

9.
确定数据集的最佳聚类数是聚类研究中的一个重要难题。为了更有效地确定数据集的最佳聚类数,该文提出了通过改进K-means算法并结合一个不依赖于具体算法的有效性指标Q(c)对数据集的最佳聚类数进行确定的方法。理论分析和实验结果证明了该方法具有良好的性能和有效性。  相似文献   

10.
一种优化初始中心点的K平均文本聚类算法   总被引:5,自引:0,他引:5  
文本聚类在信息过滤,网页分类中有着很好的应用。但它面临数据量大,特征维度高的难点。由于K平均算法易于实现,对数据依赖度底,在文本聚类中得到应用。然而,传统K平均以及它的变种会产生有较大波动的聚类结果。因此对K平均算法进行了改进,通过优化聚类初始中心的选择,得到一种适合对文本数据聚类分析的改进算法。大量实验显示,该算法可以生成质量较高而且聚类质量波动性较小的结果。  相似文献   

11.
针对二进制相移键控(binary phase shift keying,BPSK)信号在低信噪比下解调误码率较高的问题,提出了一种基于混沌Duffing振子的K-means解调方法。该方法的思想是根据混沌Duffing振子系统对初值的敏感性以及对噪声的免疫特性,低信噪比下Duffing振子系统输入BPSK信号时,由于BPSK信号相位在0°和π之间的跳变从而导致Duffing振子输出相轨迹状态发生改变。针对相轨迹状态的变化,采用K-means聚类算法对相轨迹进行迭代求质心,根据收敛后的质心间距大小对BPSK信号进行判决解调。仿真结果表明,与现有的几种解调方法相比较,基于混沌Duffing振子的BPSK信号K-means聚类解调方法在低信噪比下解调速度、解调精度等方面都有了较大的提高。  相似文献   

12.
命名实体的网络话题K-means动态检测方法   总被引:1,自引:0,他引:1  
针对传统的网络话题检测方法在文本特征表示方面的不足及K-means聚类算法面临的问题,提出了一种基于命名实体的网络话题K-means动态检测方法.该方法对传统话题检测的特征表示方法进行了改进,用命名实体和文本特征词相结合表示文本特征,用命名实体对文本表示的贡献大小表示命名实体的权重;另外,利用自适应技术对K-means聚类算法中的K值进行自收敛,对K-means聚类算法进行了优化,利用K值的动态选取来实现网络话题的动态检测.实验结果表明,该方法较好地区分了相似话题,有效提高了话题检测的性能.  相似文献   

13.
K均值聚类分割是一种有效的基于聚类的图像分割算法.传统的K均值聚类分割算法采用特征空间中的相似性测度来度量像素的归属类别.由于自然景物图像的复杂性,位置邻近且本应属于同一分割区域的像素点,由于它们视觉特征的差异性,导致其在特征空间中相距甚远而被分割为不同的区域.以投票的方法将像素的局部空间位置信息引入到K均值聚类分割算法中,达到了改善分割效果的目的.实验结果证实了该方法的有效性.  相似文献   

14.
K-means clustering is a very popular clustering technique, which is used in numerous applications. In the k-means clustering algorithm, each point in the dataset is assigned to the nearest cluster by calculating the distances from each point to the cluster centers. The computation of these distances is a very time-consuming task, particularly for large dataset and large number of clusters. In order to achieve high performance, we need to reduce the number of the distance calculations for each point efficiently. In this paper, we describe an FPGA implementation of k-means clustering for color images based on the filtering algorithm. In our implementation, when calculating the distances for each point, clusters which are apparently not closer to the point than other clusters are filtered out using kd-trees which are dynamically generated on the FPGA in each iteration of k-means clustering. The performance of our system for 512 × 512 and 640 × 480  pixel images (24-bit full color RGB) is more than 30 fps, and 20–30 fps for 756 × 512 pixel images in average when dividing to 256 clusters.
Tsutomu Maruyama (Corresponding author)Email:
  相似文献   

15.
姜大庆  周勇  夏士雄 《计算机应用》2012,32(6):1522-1525
为了从多源复杂的网络性能数据中挖掘有用模式以提高网络服务质量,研究了基于本体的网络性能监测数据聚类分析方法。阐述了网络性能监测数据的语义描述方法,提出基于语义和属性数据相融合的网络性能数据相似性度量模型,并给出基于改进k-means的NJW谱聚类算法。通过在UCI数据集和校园网性能监测数据集上的实验表明, 本文所提方法较相关比对方法具有更高的聚类准确性和区分度。  相似文献   

16.
K-means算法最佳聚类数确定方法   总被引:10,自引:0,他引:10  
K-means聚类算法是以确定的类数k为前提对数据集进行聚类的,通常聚类数事先无法确定。从样本几何结构的角度设计了一种新的聚类有效性指标,在此基础上提出了一种新的确定K-means算法最佳聚类数的方法。理论研究和实验结果验证了以上算法方案的有效性和良好性能。  相似文献   

17.
Why would R&D employees be willing to use an electronic knowledge repository (EKR) for knowledge-sharing? This study integrates a technology acceptance model (TAM) to investigate the influence of extrinsic and intrinsic motivations on R&D employees' acceptance of an EKR for knowledge-sharing. Empirical data were collected through a survey, which gathered data from 225 employees working in 10 organisations in Taiwan. The results indicated that (1) reputation and reciprocity were found to be two important antecedents to perceived usefulness and perceived ease of use; (2) altruism was also found to be an important antecedent to perceived ease of use; (3) reputation was the most influential factor of perceived usefulness, and another influential factor of perceived usefulness was reciprocity. Three knowledge-sharing motivations that significantly affect the perceived ease of use were listed as reciprocity, altruism, and reputation, according to the relative importance; (4) altruism plays an important role in explaining the EKR usage intentions for knowledge-sharing both directly and indirectly; and (5) the results were consistent with the propositions of TAM. This study contributes theoretically and empirically to the body of EKR usage research and also has practical implications.  相似文献   

18.
对不规范畜禽养殖整治项目实施后的绩效评价,对于规范与指导养殖整治具有重要意义。以上海市A区不规范畜禽养殖整治项目为例,从经济效益、社会效益、环境效益和可持续影响4个方面构建不规范畜禽养殖绩效评价多级指标体系。为有效降低主观因素对评价结果的影响,本文通过构建指标体系模糊比较矩阵,进而构造判断矩阵及其拟优一致矩阵,最终得到评价体系各指标重要性排序结果,并进一步分析了治理工作实施中存在的问题及后期实施建议,对提高不规范畜禽养殖整治状况评价的客观性和后期管理具有一定的实用价值。  相似文献   

19.
针对短文本聚类存在的三个主要挑战,特征关键词的稀疏性、高维空间处理的复杂性和簇的可理解性,提出了一种结合语义改进的K-means短文本聚类算法。该算法通过词语集合表示短文本,缓解了短文本特征关键词的稀疏性问题;通过挖掘短文本集的最大频繁词集获取初始聚类中心,有效克服了K-means聚类算法对初始聚类中心敏感的缺点,解决了簇的理解性问题;通过结合TF-IDF值的语义相似度计算文档之间的相似度,避免了高维空间的运算。实验结果表明,从语义角度出发实现的短文本聚类算法优于传统的短文本聚类算法。  相似文献   

20.
介绍了K-means和GAAC聚类算法思想和两种特征提取方法对维吾尔文文本表示及聚类效率的影响.在较大规模文本语料库基础上,分别用K-means和GAAC的方法进行维吾尔文文本聚类实验及性能对比分析,针对经典K-means算法对初始聚类中心的过分依赖性及不稳定性缺点以及GAAC的高计算复杂性,提出了一种结合GACC和K-means的维吾尔文聚类算法.本算法分两步完成聚类操作,首先是GAAC模块从少量文本集中获取最优的初始类中心,然后是K-means模块对大量文本集进行快速聚类.实验结果表明,新算法在聚类准确率和时间复杂度上都有了显著的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号