首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
A supervised learning pattern classifier, called the extension neural network (ENN), has been described in a recent paper. In this sequel, the unsupervised learning pattern clustering sibling called the extension neural network type 2 (ENN-2) is proposed. This new neural network uses an extension distance (ED) to measure the similarity between data and the cluster center. It does not require an initial guess of the cluster center coordinates, nor of the initial number of clusters. The clustering process is controlled by a distanced parameter and by a novel extension distance. It shows the same capability as human memory systems to keep stability and plasticity characteristics at the same time, and it can produce meaningful weights after learning. Moreover, the structure of the proposed ENN-2 is simpler and the learning time is shorter than traditional neural networks. Experimental results from five different examples, including three benchmark data sets and two practical applications, verify the effectiveness and applicability of the proposed work.  相似文献   

2.
以图计算形式研究社交网络由来已久,但对于如何提升图计算应用于大规模社交网络的计算速度和扩展性,一直是研究的难点。谱图论的应用为社交网络在图计算方面的研究带来新的研究热点,谱图分割为社交网络社区划分带来基于结构的支撑。为了解决谱图论在处理大规模社交网络时存在计算缓慢、内存溢出等问题,本文提出了谱聚类改进算法结合矩阵方式在并行环境下的处理方法。首先,利用Spark对网络数据进行并行化预处理,将社交网络以图结构表示,再将图转化为Spark分布式稀疏矩阵。然后,将谱聚类改进算法在Spark环境下,实现并行化社交网络社区快速划分,并以分布式方式持久化存储源数据、中间计算数据和计算结果,提高图计算在社交网络中的可靠性。最后,通过实验证明并行化图计算方法能有效提高计算速度和扩展性,支持大规模社交网络的挖掘分析,实现并行算法下高并发、高吞吐的特点。  相似文献   

3.
计算语言学领域多采取问句分类和句法分析相结合的方式处理疑问句,但精度和效率还不理想。疑问句的语言学研究成果丰富,比如疑问句的结构类型、疑问焦点等,但缺乏系统的形式化表示。该文采用基于图结构的句子语义整体表示方法——中文抽象语义表示来标注疑问句的语义结构,将疑问焦点和整句语义一体化表示出来,选取了宾州中文树库、小学语文教材等2万句语料中共计2 071个疑问句进行标注。统计结果表明,疑问焦点可通过疑问概念amr-unknown和语义关系的组合来表示。其次,根据疑问代词所关联的语义关系,统计了疑问焦点的概率分布,发现原因、修饰语和受事的占比最高,分别占26.45%、16.74%以及16.45%。基于抽象语义表示的疑问句标注与分析可以为汉语疑问句研究提供基础理论与资源。  相似文献   

4.
BIRCH: A New Data Clustering Algorithm and Its Applications   总被引:14,自引:0,他引:14  
Data clustering is an important technique for exploratory data analysis, and has been studied for several years. It has been shown to be useful in many practical domains such as data classification and image processing. Recently, there has been a growing emphasis on exploratory analysis of very large datasets to discover useful patterns and/or correlations among attributes. This is called data mining, and data clustering is regarded as a particular branch. However existing data clustering methods do not adequately address the problem of processing large datasets with a limited amount of resources (e.g., memory and cpu cycles). So as the dataset size increases, they do not scale up well in terms of memory requirement, running time, and result quality.In this paper, an efficient and scalable data clustering method is proposed, based on a new in-memory data structure called CF-tree, which serves as an in-memory summary of the data distribution. We have implemented it in a system called BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), and studied its performance extensively in terms of memory requirements, running time, clustering quality, stability and scalability; we also compare it with other available methods. Finally, BIRCH is applied to solve two real-life problems: one is building an iterative and interactive pixel classification tool, and the other is generating the initial codebook for image compression.  相似文献   

5.
针对k-means算法过度依赖初始聚类中心、收敛速度慢等局限性及其在处理海量数据时存在的内存不足问题,提出一种新的针对大数据集的混合聚类算法super-k-means,将改进的基于超网络的高维数据聚类算法与k-means相结合,并经过MapReduce并行化后部署在Hadoop集群上运行。实验表明,该算法不仅在收敛性以及聚类精度两方面得到优化,其加速比和扩展性也有了大幅度的改善。  相似文献   

6.
余莉  李佳田  李佳  段平  王华 《计算机应用》2011,31(5):1328-1330
ART2网络是一种著名的聚类方法,已实际应用于诸多领域,其作用于二维空间数据,不仅存在模式漂移和向量幅度信息缺失的问题,而且难以适应不规则形态分布的空间数据的聚类。提出了一种树ART2网络模型(TART2),通过长期记忆(LTM)模式的调整和向量幅度信息的学习,使ART2网络保持了带空间距离约束的旧模式记忆;引入树结构优化,降低了警戒参数设置的主观要求,减少了模式交混现象的发生。对比实验结果表明,TART2网络更适用于带状分布的空间数据聚类,具有较高的可塑性和自适应性。  相似文献   

7.
随着信息技术的不断进步,数据规模不断增大。聚类是一种典型的数据分析方法,尤其是对大规模数据进行聚类分析近年来备受关注。针对现有序列聚类算法在对大规模数据进行聚类时,在内存空间和计算时间方面开销较大的问题,提出了基于MapReduce的人工蜂群聚类算法,通过引入MapReduce并行编程范式,快速计算聚类中心适应度,可实现对大规模数据的高效聚类。基于仿真和真实的磁盘驱动器制造两类数据,对算法的聚类效果、可扩展性和聚类效率进行了验证。实验结果表明,与现有PK-Means算法和并行K-PSO算法相比,论文算法具有更好的聚类效果、更强的扩展性和更高的聚类效率。  相似文献   

8.
电磁无损检测技术是无损检测领域的一个研究重点,针对电磁无损检测技术中的超声波处理,提出了一种基于FPFA的参数优化的RBF神经网络;首先,通过FPGA编程实现对电磁超声波信号的采集,设计了放大电路将原始的电磁超声波进行放大处理已满足RBF神经网络的需求;提出一种采用K-means聚类算法来计算RBF中径向基函数的中心和宽度的参数优化RBF算法,K-means聚类算法的初始聚类中心难以确定会导致RBF算法的参数无法优化,提出KL散度,采用数据密度分析法来计算K-means算法的聚类中心;试验表明,改进后的K-means算法的聚类误差的数量级为10~(-12),传统K-means算法的聚类误差为10~(-13),改进后的K-means算法的聚类结果更准;参数优化后的RBF神经神级网络对具有1.02 mm缺陷长度的发动机涡轮叶片的缺陷长度预测结果为0.9~1.1 mm,传统的RBF神经网络的预测结果为0.7~1.2 mm,参数优化后的RBF神经网络的预测结果更准确。  相似文献   

9.
Wireless technologies usually have very limited computing, memory, and battery power that require the optimal management of network resources to increase network performance. The optimization of these network resources provides an efficient network topology, traffic control, routing, and data aggregation. This study presents a qualitative and quantitative investigation to evaluate the efficient network resource management mechanisms for software defined wireless sensor networks (SDN-enabled WSNs) from the beginning of network design to reliable data delivery. In this paper, a taxonomy of network resource management research studies is proposed. A detailed analysis of SDN-enabled WSNs architecture, SDN controllers, topology discovery, routing approaches, flow rules installation, and data aggregation is also discussed. Furthermore, the comparative analysis of resource provisioning methods along with various simulation tools is presented. Moreover, this review outlines open research challenges and prospective future directions for network resource management in SDN-enabled WSNs.  相似文献   

10.
提出一种新的聚类算法AIK-Means,利用CUDA技术加速算法执行效率,并优化内存方法,可在有限时间内进行多次聚类;将Chameleon层次聚类算法用于解决K-Means算法的初始聚类中心敏感问题;在多次聚类结果中用FP-Tree进行关联分析,提高聚类有效性。将算法应用到某集团心理学MMPI数据测试,实验结果表明AIK-Means算法在执行效率和聚类有效性上具有良好的效果。  相似文献   

11.
高阶链接预测是当前网络分析研究的热点和难点,一个优秀的高阶链接预测算法不仅可以挖掘出复杂网络中节点间存在的潜在联系,还有助于认识网络结构随时间演化的规律,对于探索未知的网络关系有着重要的作用.大多数传统的链接预测算法仅考虑节点间的结构相似性特征,而忽略高阶结构的特性以及网络变化的信息.本文提出了一种基于Motif聚集系数与时序划分的高阶链接预测模型(简称MTLP模型),该模型通过提取网络中高阶结构的Motif聚集系数特征和网络结构演变等特征,将其构建成可表示性特征向量,并使用多层感知器网络模型进行训练完成链接预测任务.该模型能够同时结合网络中高阶结构的聚集特征与网络结构演变信息,从而改善预测效果.通过在不同的数据集上进行实验,其结果表明,本文所提出的MTLP模型具有更好的高阶链接预测性能.  相似文献   

12.
网络聚类模式发现是网络分析中的一项重要任务,好的网络布局应能体现网络中的聚类特征,并允许用户从不同层次探索网络结构。为此,基于社团划分和多层次布局思想提出了聚类特征层次布局算法。首先利用种子节点和个性化PageRank对网络实现社团划分;其次根据划分结果对网络进行粗化,并设计了粗化网络初始布局;然后利用节点度信息改进力导向模型以完成细化;最后,为验证所提算法的有效性,设计了从整体到局部的实验。实验表明所提算法能够在有效时间内生成高质量的布局结果,与现有布局算法相比,所提算法更能真实展示网络聚类特征,同时兼顾网络微观结构,能够满足用户从不同层次探索网络结构的需要。  相似文献   

13.
王映辉 《计算机工程》2009,35(10):121-125
针对传统的分簇方法很少考虑安全因素,或者只考虑安全性而忽视对网络性能影响的问题,提出一种基于信任关系的分簇方法。该方法结合人类记忆的扩散激发模型的思想,能够根据有限的局部信息,自动地对整个网络进行分割,在提高AdHoc网络性能的同时,还可提高其安全性。实验结果表明,该分簇方法在精确度方面与集中式的分簇方法非常接近。  相似文献   

14.
研究表明,很多真实网络具有层次结构和重叠结构。传统的层次聚类算法通常以节点为对象进行扩展形成层次树图从而得到网络的层次结构。这种做法存在两个问题,其一是算法的稳定性,主要体现在初始节点的选择上,少数情况下,初始节点的不同会导致算法最终结果的不同,即使算法的结果不依赖于初始节点,但算法的复杂度会随之变化;其二是不能发现网络中的重叠结构。针对以上问题,提出一种基于最大团的层次化重叠社区发现算法。该算法以最大团为扩展对象,然后利用最大团扩展策略生成层次树图,最后采用重叠模块度函数对层次树图进行剪枝得到社区划分结果。在真实网络以及LFR人工网络上的实验结果表明该算法能够有效地挖掘网络中的层次结构和重叠结构。  相似文献   

15.
GIS中最短路径的算法研究与仿真   总被引:16,自引:3,他引:13  
最短路径是GIS应用中的主要问题之一。通过对GIS中最短路径理论和实现算法的分析和研究 ,该文对传统的Dijk stra算法和启发式搜索算法A 算法进行了详细的探讨 ,并说明了各自的特点及适用条件。在对一些最短路径算法测试结果总结的基础上 ,根据GIS中网络计算的实际情况 ,对搜索算法的数据结构和存储方式进行了优化。最后 ,利用MapObjects组件对国家基础地理信息系统 (NFGIS)中的公路数据文件进行了仿真分析 ,得出一些有益的结论。  相似文献   

16.
基于分级神经网络的Web文档模糊聚类技术   总被引:1,自引:1,他引:1  
给出了一种多层向量空间模型,该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重.然后提出了一种简明而有效的基于分级神经网络的模糊聚类算法.与现有方法不同,该模糊聚类方法采用自组织神经网络和模糊聚类网络两部分组成的3层神经网络来实现.首先采用自组织神经网络从原始数据产生一个初始聚类结果,然后运用FCM方法对初始聚类的数目进行优化.实验结果表明,提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的web文档较完全和准确地聚成一类.  相似文献   

17.
Clustering issues are fundamental to exploratory analysis of bioinformatics data. This process may follow algorithms that are reproducible but make assumptions about, for instance, the ability to estimate the global structure by successful local agglomeration or alternatively, they use pattern recognition methods that are sensitive to the initial conditions. This paper reviews two clustering methodologies and highlights the differences that result from the changes in data representation, applied to a protein expression data set for breast cancer (n = 1,076). The two clustering methodologies are a reproducible approach to model-free clustering and a probabilistic competitive neural network. The results from the two methods are compared with existing studies of the same data set, and the preferred clustering solutions are profiled for clinical interpretation.  相似文献   

18.
以用户情感需求为导向进行产品的设计和营销定位已成为研究热点,细粒度的情感挖掘可进一步提高评论分析的效率。提出一种面向方面深度记忆网络模型进行细粒度情感分析。对京东等IT产品评论数据进行爬取,应用依存句法分析方法抽取评论中的方面词,采用基于self-attention机制的深度记忆网络模型实现基于方面的细粒度情感分类。实验结果表明,面向方面深度记忆网络模型在英文数据集上的准确率相比一些经典模型有所提升,同时在京东等40?000条IT的用户评价数据进行情感倾向分析也具有良好的效果。  相似文献   

19.
一种新型的模糊C均值聚类初始化方法   总被引:10,自引:0,他引:10  
刘笛  朱学峰  苏彩红 《计算机仿真》2004,21(11):148-151
模糊C均值聚类(FCM)是一种广泛采用的动态聚类方法,其聚类效果往往受初始聚类中心的影响。受自适应免疫系统对入侵机体的抗原产生免疫记忆的机理启示,提出了一种新的产生初始聚类中心的方法。算法中,待分析的数据被视为入侵性抗原,产生的记忆细胞作为聚类分析的初始中心。克隆选择用来产生抗原的记忆细胞群体,免疫网络理论则用来抑制该群体规模的快速增长。实验结果表明免疫记忆机理用于FCM初始中心的选择是可行的,不仅提高了FCM算法的收敛速度,而且可以通过改变阈值的大小自动决定类别数。  相似文献   

20.
邢长征  胡权波 《计算机工程》2013,(12):247-250,259
处理倾斜分布特征的数据流聚类算法TDCA存在聚类速度与内存利用率上的不足,且变流速的数据流环境对聚类结果的质量有严重影响。针对上述问题,提出一种数据流聚类算法GR—Stream。采用网格单元作为数据点的聚集形式,以基于R.tree的扩展数据结构作为组织网格单元的索引结构,在此基础上引入剪枝策略,并调整数据点进入树的方式。在真实数据集KDD.CUP99上进行测试,结果表明,与TDCA算法相比,该算法在聚类过程中可以提高40%的访问速度,应用剪枝策略节省至少一半的内存使用量,同时在变流速的数据流环境下将聚类结果的平均纯度保持在90%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号