首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
提出一种基于本体的网络会话表示方法,即语义会话,和一种会话聚类和可视化方法。会话聚类方面基于用户浏览网站的公共路径提出一种语义会话间的相似性度量——语义公共路径相似性度量(SMSCP),并且使用改进的kmedoids聚类算法衡量其有效性。在聚类结果可视化方面应用层云表来展示聚类结果。实验表明文中的聚类方法和可视化方法具有更好的有效性及可理解性。  相似文献   

2.
针对传统基于距离度量的聚类算法难以适合高维数据聚类以及高维数据之间相似度难定义的问题,提出了一种新的高维数据聚类算法.该算法基于一个能够更准确地表达出高维对象之间相似性的度量函数,首先计算对象两两之间的相似度并得出一个相似度矩阵,然后根据该相似度矩阵和阈值大小自底向上对数据进行聚类分析.实验结果显示,该算法能够获得质量更高的聚类结果,并且不受孤立点影响,对输入数据顺序也不敏感.  相似文献   

3.
王刚  钟国祥 《计算机科学》2010,37(9):222-224
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Based on Ontology).该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系.设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法.实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量.  相似文献   

4.
陈崚  邹凌君  屠莉 《计算机应用》2007,27(8):1976-1979
针对当前对多条数据流的聚类算法不能兼顾质量和效率的矛盾,提出了基于相关系数的多条数据流的聚类算法,实现固定长度的在线动态聚类。算法引入衰减系数提高聚类质量,以相关系数作为流数据间相似度的度量标准,将数据流划分若干个数据段,以各数据流的相关统计信息进行聚类,得到实时的聚类结构。实验结果表明,算法有较高的效率、聚类质量和稳定性。  相似文献   

5.
聚类分析是数据挖掘中一种非常重要的技术.聚类算法中的关键问题是相异度或相似度的度量,聚类结果直接依赖于相异度或相似度度量,尤其对于谱聚类方法更是如此.谱聚类算法是近期兴起的一种基于相似度矩阵的聚类算法.相比于传统的划分型聚类算法,谱聚类算法不受限于球状聚类簇,能够发现不规则形状的聚类簇.在已有的谱聚类算法中,高斯核相似度是最常用的相似度度量准则.基于高斯核相似度度量及其扩展形式,提出了一种加权的自适应的相似度度量,此相似度可以用于谱聚类以及其他基于相似度矩阵的聚类算法.新的相似度度量不仅能够描述多密度聚类簇中数据点间的相似度,而且可以降低离群点(噪声点)与其他数据点间的相似度.实验结果显示新的相似度度量可以更好地描述不同类型的数据集中数据点间的相似度,进而得到更好的聚类结果.  相似文献   

6.
提出一种基于动态时间弯曲算法距离度量的探地雷达数据可视化方法,利用动态 时间弯曲算法在时间轴方向上伸缩的优越性,结合可指定类数的聚类算法对探地雷达数据进行 聚类和可视化分析。可用于实测的探地雷达数据集,实验结果表明,相对于传统的聚类算法, 本文算法能得到更好的聚类结果。  相似文献   

7.
谱聚类算法受到度量中尺度因子的影响,同时传统谱聚类算法通过欧氏距离度量样本间相似性也不准确。针对上述问题,提出一种基于传递距离的谱聚类算法。算法首先通过改进传统谱聚类中的度量方式,用基于传递距离的度量方式度量样本间相似性,并构建传递矩阵,接着用传递矩阵做相似度变换构建拉普拉斯矩阵,最终通过求特征值和特征向量完成聚类。基于传递距离的谱聚类算法在人工数据集及UCI数据集上均取得了良好的聚类结果,具有较好的鲁棒性和有效性。  相似文献   

8.
基于本体及相似度的文本聚类研究*   总被引:1,自引:0,他引:1  
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类忽略概念的内涵及缺少概念间的联系,设计和改进了基于本体和相似度的文本聚类方法TCBOS(text clustering based on ontology and similarity)。研究了文本预处理及分词的方法,设计了用有限状态自动机来自动提取概念和关系的方法,对概念语义扩展和相似度计算方法进行了改进和完善,通过应用本体的语义相似度来度量文档间相近程度,完善了根据相似度进行文本聚类的K中心点算法。实验证明,该方法从聚类的准确性和聚类的关联度方  相似文献   

9.
针对现有基于语义知识规则分析的文本相似性度量方法存在时间复杂度高的局限性,提出基于分类词典的文本相似性度量方法。利用汉语词法分析系统ICTCLAS对文本分词,运用TF×IDF方法提取文本关键词,遍历分类词典获取关键词编码,通过计算文本关键词编码的近似性来衡量原始文本之间的相似度。选取基于语义知识规则和基于统计两个类别的相似性度量方法作为对比方法,通过传统聚类与KNN分类分别对相似性度量方法进行效果验证。数值实验结果表明,新方法在聚类与分类实验中均能取得较好的实验结果,相较于其他基于语义分析的相似性度量方法还具有良好的时间效率。  相似文献   

10.
传统谱聚类算法存在聚类效果差的缺陷,为此提出基于小波分析的网络通信大数据谱聚类算法研究。采用小波分析方法对采集到的电网通信网络大数据的相异性进行度量,将得到的相异性度量结果转换为数据之间的相似性,并对网络通信大数据相似性关系进行构建,得到网络通信大数据的相似度矩阵,以上述得到的网络通信大数据相似度矩阵为基础,采用聚类算法对数据进行聚类,实现了网络通信大数据的谱聚类。通过实验可得,提出的谱聚类算法的准确率与纯度分别高出传统算法34%与21.2%,说明提出的基于小波分析的谱聚类算法具备极好的聚类效果。  相似文献   

11.
12.
为了解决多维数据的维数过高、数据量过大带来的平行坐标可视化图形线条密集交叠以及数据规律特征不易获取的问题,提出基于主成分分析和K-means聚类的平行坐标(PCAKP,principal component analysis and k-means clustering parallel coordinate)可视化方法。该方法首先对多维数据采用主成分分析方法进行降维处理,其次对降维后的数据采用K-means聚类处理,最后对聚类得到的数据采用平行坐标可视化技术进行可视化展示。以统计局网站发布的数据为测试数据,对PCAKP可视化方法进行测试,与传统平行坐标可视化图形进行对比,验证了PCAKP可视化方法的实用性和有效性。  相似文献   

13.
王晓星 《机器人》1989,3(4):40-44
从基坐标系到任一坐标系的旋转变换,可以通过绕给定轴的一次旋转运动来实现。本文用球面向量方法给出解决等效旋转的几何模型。  相似文献   

14.
介绍了NDDS(NanDa Dolphin Searcher)系统的设计与实现的关键技术。系统使用VSM(Vector Space Model)技术来自动地确定搜索主题。智能Crawler技术能够有目标、有选择地发现新的相关资源。链接分析技术用来分析发现最重要的资源,对资源按重要性进行排序。NDDS的两种运行方式分别提供了个性化搜索服务和共享资源服务。  相似文献   

15.
针对模式分类算法不直观的问题,提出一种基于径向坐标可视化分析高维数据的方法。由最大似然原理估计高维数据的本征维数,用较少的变量结合径向坐标可视化方法对高维数据进行可视化降维分析。在径向坐标中揭示高维数据集中类别和特征间的关系,寻找基于不同特征排列顺序的最优映射,并结合多种机器学习方法对数据集进行分类。应用于UCI数据库中的6个数据集的结果表明,该方法具有较好的可视化和分类效果。  相似文献   

16.
资源搜索是P2P网络的关键问题.介绍了Cmutella网络资源搜索路由机制,分析了Gnutella网络的现有改进算法及其存在的问题,针对这些问题,提出了一种基于询问-应答策略的网络资源搜索路由机制的改进策略,在不影响搜索效率的情况下,能减少大量的冗余信息和有效地提高可扩展性,并且还具有自适应性.  相似文献   

17.
易先卉  彭黎 《计算机工程》2008,34(22):57-59
关联规则可视化技术中普遍存在界面紊乱、产生歧义等问题。该文提出一种新的关联规则可视化方法ARVMiner,利用三维坐标可视化技术改进现有可视化技术的不足。采用Java 3D可视化技术实现了基于ARVMiner的关联规则可视化系统原型。实验表明,该系统能够有效、有序地显示大量多种关系的关联规则,用户可以根据给定的约束条件进行有选择的挖掘。  相似文献   

18.
为提高可视化资源的使用效率,提出一种可视化资源网格化方法。研究网格环境下可视化资源共享的体系结构和工作模式以及可视化资源服务化封装方法。可视化服务利用帧缓存捕捉可视化程序运行屏幕并保存为图像文件,通过Web服务器传送至远程的客户端显示。用户通过客户端向可视化服务提出请求,该请求被封装为XML格式文件,包含可视化任务执行所需参数描述信息。以虚拟样机可视化虚拟环境的网格化为例,验证了该方法的有效性。  相似文献   

19.
导助航信息的三维可视化为船员提供清晰、直观的画面,方便船员准确地判断和掌握船舶所处的空间位置、水文环境、行进方向等重要信息。分析了整个三维可视化系统的体系结构;对导助航信息三维可视化的关键技术进行了研究,通过斜墨卡托投影实现地理坐标系到世界坐标系的坐标转换;提出一种方法计算航标位置、偏转角度用以指示锚地位置、船舶停靠方式;通过几何对象可视化进行导助航信息的动态展示。实验结果表明,该系统能够很好地解决船舶雾天通航因能见度低所造成的滞航问题,引导船舶航行和定位。  相似文献   

20.
With the rapid growth of networked data communications in size and complexity, network administrators today are facing more challenges to protect their networked computers and devices from all kinds of attacks. This paper proposes a new concentric-circle visualization method for visualizing multi-dimensional network data. This method can be used to identify the main features of network attacks, such as DDoS attack, by displaying their recognizable visual patterns. To reduce the edge overlaps and crossings, we arrange multiple axes displayed as concentric circles rather than the traditional parallel lines. In our method, we use polycurves to link values (vertexes) rather than polylines used in parallel coordinate approach. Some heuristics are applied in our new method in order to improve the readability of views. We discuss the advantages as well as the limitations of our new method. In comparison with the parallel coordinate visualization, our approach can reduce more than 15% of the edge overlaps and crossings. In the second stage of the method, we have further enhanced the readability of views by increasing the edge crossing angle. Finally, we introduce our prototype system: a visual interactive network scan detection system called CCScanViewer. It is based on our new visualization approach and the experiments have showed that the new approach is effective in detecting attack features from a variety of networking patterns, such as the features of network scans and DDoS attacks.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号