首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
专利的功能信息对专利规避及创新具有重要意义.为了完成对专利基于功能的聚类,提出一种面向功能信息的相似专利动态聚类混合模型.该模型筛选功能信息句,运用双向长短期记忆网络联合注意力机制、卷积神经网络、改进的权值主题模型抽取专利文本的序列特征、文本嵌入特征、主题特征,同时加入功能词语关注部分,采用并行融合的方式提取特征.将所有特征表示作为聚类的输入,聚类结果作为反馈信息实现动态聚类.选取无机化学类方面的专利进行实验,实验结果表明,该模型能够提高聚类的F-measure值,同时也能提高时间效率.  相似文献   

2.
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,提出了一种基于句向量(Doc2vec)和卷积神经网络(convolutional neural networks,CNN)的文本特征提取方法用于文本聚类。首先利用Doc2vec模型把训练数据集中的文本转换成句向量,充分考虑文档词排列顺序和语义;然后利用CNN提取文本的深层语义特征,解决特征维度高的问题,得到能够用于聚类的文本特征向量;最后使用[k]-means算法进行聚类。实验结果表明,在爬取的搜狗新闻数据上,该文本聚类模型的准确率达到了0.776,F值指标达到了0.780,相比其他文本聚类模型均有所提高。  相似文献   

3.
覃晓  元昌安 《计算机应用》2008,28(3):757-760
自组织映射(SOM)算法作为一种聚类和高维可视化的无监督学习算法,为进行中文Web文档聚类提供了有力的手段。但是SOM算法天然存在着对网络初始权值敏感的缺陷,从而影响聚类质量。为此,引进遗传算法对SOM网络加以优化。提出了以遗传算法优化SOM网络的文本聚类算法(GSTCA);进行了对比实验,实验表明,改进后的算法GSTCA比SOM算法在Web中文文档聚类中具有更高的准确率,其F-measure值平均提高了14%,同时,实验还表明,GSTCA算法对网络初始权值是不敏感的,从而提高了算法的稳定性。  相似文献   

4.
基于潜在语义分析和自组织特征映射神经网络(LSA—SOM),本文提出一种文本聚类方法。采用潜在语义分析的理论表示文本特征向量,以体现特征词的语义关系并实现特征向量的降维。利用SOM网络算法进行无监督自组织学习,并通过不断调节网络节点间的权向量来实现文本聚类。该方法不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,克服传统方法中文本种类需要预先给定的缺点。  相似文献   

5.
自组织映射算法是一种重要的聚类模型,能够有效提高搜索引擎的精确性。为克服自组织映射网络对于初始连接权值敏感的不足,提出一种改进的差分进化和SOM相结合的组合文档聚类算法IDE-SOM,首先引入一种改进的差分进化算法对文档集进行一次粗聚类,旨在对SOM网络的初始连接权值进行优化,然后将这个连接权值初始化SOM网络进行细聚类。仿真实验表明,该算法在F-measure、熵等评价指标上都获得了较好的聚类效果。  相似文献   

6.
文本聚类的核心问题是找到一种优化的聚类算法对文本向量进行聚类,是典型的高维数据聚类,提出一种基于自组织神经网络SOM和人工免疫网络aiNet的两阶段文本聚类算法TCBSA。新算法先用SOM神经网络进行聚类,把高维的文本数据映射到二维的平面上,然后再用aiNet对文本聚类。该方法利用SOM神经网络对高维数据降维的优点,克服了人工免疫网络对高维数据的聚类能力差的缺点。仿真实验结果表明该文本聚类算法不仅是可行的,而且具有一定的自适应能力和较好的聚类效果。  相似文献   

7.
针对目前基于深度卷积神经网络的显著性检测算法存在对复杂场景图像目标检测不完整、背景噪声多的问题,提出一种深度特征导向显著性检测算法。该算法是基于现有底层特征与深度卷积特征融合模型(ELD)的改进,网络模型包含基础特征提取、高层语义特征跨层级引导传递两个部分。首先,根据不同层级卷积特征的差异性,构建跨层级特征联合的高层语义特征引导模型;然后,用改进的网络模型生成初始显著图,利用高层语义特征引导的方式进行显著性聚类传播;最后,用完全联系条件随机场对聚类传播的结果进行优化,使其能够获取更多结构边缘信息和降低噪声并生成完整显著图。在ECSSD上和DUT-ORMON两个数据集上进行实验测试,实验结果表明,所提算法的准确率和召回率(PR)优于ELD模型,其F-measure(F)值分别提升了7.5%和11%,平均绝对误差(MAE)值分别降低了16%和15%,说明了所提算法模型能够在目标识别、模式识别、图像索引等复杂图像场景应用领域得到更加鲁棒的结果。  相似文献   

8.
GPS 定位系统对车辆的运行调控以及拥堵性分析具有重要意义。但定时采样的GPS 数据难免存在坏点的情 况,而坏点的存在对分析结果容易产生较大错误,从而影响交通管理决策。本文通过高斯混合模型、K-均值聚类分析以及 SOM 自组织神经网络三种方法完成对原始数据时间段划分、字段提取以及坏值清理的操作。这三种方法主要用于对数据进 行聚类分析,根据分析结果识别孤立点从而进行清理。结果显示,高斯聚类与K-均值聚类算法的坏点识别精度小于SOM 自 组织神经网络,但前两种算法的运行效率较后者高。  相似文献   

9.
关于自组织神经网络应用的综述   总被引:1,自引:0,他引:1  
自组织神经网络(SOM)是人工神经网络中一个重要的类型,是一种元监督的聚类网络,已广泛应用于样本分类、样本排序和样本检测等方面。本文主要阐述自组织神经网络中的自组织特征映射网络模型(SOFM)及其改进模型在生产实践中的应用。  相似文献   

10.
卷积神经网络(CNN)因其容易产生过拟合而困扰着广大研究者。产生过拟合的重要原因在于模型往往局限于局部最优解。针对此问题,提出了基于谱聚类的增强神经网络模型。使用谱聚类算法对验证集进行聚类,以聚类结果为依据将单任务模型扩展为多任务学习模型。用公开的声音场景识别数据集进行实验,实验结果表明,基于谱聚类的增强神经网络模型可以有效降低过拟合风险,提升模型的测试精度。该方法适用于除声音场景识别(ASC)领域的其他领域。  相似文献   

11.
通过使用SOM(Self-Orgahizing Map)进行聚类分析,得到自组织语义图,同时针对其中某些情况使用传统聚类算法k-medoids算法,在输出模块中确定每一类中的内容,以获得更为精确的结果并结合到本体内,用于解决由支持本体的构建和维护而引发的自动化问题。  相似文献   

12.
Classical clustering methods, such as partitioning and hierarchical clustering algorithms, often fail to deliver satisfactory results, given clusters of arbitrary shapes. Motivated by a clustering validity index based on inter-cluster and intra-cluster density, we propose that the clustering validity index be used not only globally to find optimal partitions of input data, but also locally to determine which two neighboring clusters are to be merged in a hierarchical clustering of Self-Organizing Map (SOM). A new two-level SOM-based clustering algorithm using the clustering validity index is also proposed. Experimental results on synthetic and real data sets demonstrate that the proposed clustering algorithm is able to cluster data in a better way than classical clustering algorithms on an SOM.  相似文献   

13.
针对利用自组织特征映射(SOFM)神经网络进行模糊聚类时出现的一些问题,提出改进结构的神经网络,采用自适应的聚类初值,能够实现高维数据和任意形状族的聚类,与具有同样聚类效果的其他算法相比,具有较低的时间复杂度。仿真实验结果表明,该聚类算法比单个的神经网络聚类算法和同类其他算法更有效。  相似文献   

14.
Self-Organizing Map (SOM) networks have been successfully applied as a clustering method to numeric datasets. However, it is not feasible to directly apply SOM for clustering transactional data. This paper proposes the Transactions Clustering using SOM (TCSOM) algorithm for clustering binary transactional data. In the TCSOM algorithm, a normalized Dot Product norm based dissimilarity measure is utilized for measuring the distance between input vector and output neuron. And a modified weight adaptation function is employed for adjusting weights of the winner and its neighbors. More importantly, TCSOM is a one-pass algorithm, which is extremely suitable for data mining applications. Experimental results on real datasets show that TCSOM algorithm is superior to those state-of-the-art transactional data clustering algorithms with respect to clustering accuracy.  相似文献   

15.
This study proposes a clustering method based on Taguchi method for effective market segmentation. To select appropriate initial seeds, we propose the use of Taguchi method as the tools. This study compares the results of the proposed a Self-Organizing Map (SOM) for application to a real-world case of tea-beverage market segmentation. The results show that the proposed Taguchi method may improve segmentation performance.  相似文献   

16.
提出了一种利用SOM网络输出层可视化的特点进行语音训练的方法。SOM网络能够将输入向量映射到二维平面或曲面上,受试者通过视觉反馈的位置信息,指导其发音行为。为了提高SOM聚类效果,SOM还进行加强训练;讨论了SOM输出层神经元个数对聚类的影响。实验结果表明,提出的利用SOM语音训练方法,直观简单,能够有效地实现“看图说话”。  相似文献   

17.
The Self-Organizing Map (SOM) network, a variation of neural computing networks, is a categorization network developed by Kohonen. The theory of the SOM network is motivated by the observation of the operation of the brain. This paper presents the technique of SOM and shows how it may be applied as a clustering tool to group technology. A computer program for implementing the SOM neural networks is developed and the results are compared with other clustering approaches used in group technology. The study demonstrates the potential of using the Self-Organizing Map as the clustering tool for part family formation in group technology.  相似文献   

18.
The Self-Organizing Map (SOM) is a popular unsupervised neural network able to provide effective clustering and data visualization for multidimensional input datasets. In this paper, we present an application of the simulated annealing procedure to the SOM learning algorithm with the aim to obtain a fast learning and better performances in terms of quantization error. The proposed learning algorithm is called Fast Learning Self-Organized Map, and it does not affect the easiness of the basic learning algorithm of the standard SOM. The proposed learning algorithm also improves the quality of resulting maps by providing better clustering quality and topology preservation of input multi-dimensional data. Several experiments are used to compare the proposed approach with the original algorithm and some of its modification and speed-up techniques.  相似文献   

19.
基于多层自组织映射和主成分分析的入侵检测方法*   总被引:2,自引:0,他引:2  
首先改进了自组织映射学习和分类算法,通过引入自定义变量匹配度、约简率和约简样本量化误差,提出了一种新的基于多层自组织映射和主成分分析入侵检测模型与算法。模型运用主成分分析算法对输入样本进行特征约简,运用分层思想对分类精度低的聚类进行逐层细分,解决了单层自组织映射分类不精确的问题。实验结果表明该模型用于入侵检测的效果良好,能准确区分攻击与否且能进一步指出攻击的具体类型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号