共查询到19条相似文献,搜索用时 78 毫秒
1.
基于SOM算法实现的文本聚类 总被引:14,自引:0,他引:14
以自组织特征映射(Self-organizing map,SOM)算法作为理论基础,实现了对 文本文档的聚类,并且给出了相应的类别标注,同时对聚类的准确度进行了评价,由于准确 度较低而后提出了把tf·idf计算词权重的方法应用到SOM算法的输入文本向量中去,因此提 高了聚类的平均准确度。 相似文献
2.
随着信息的爆炸式增长,现有的搜索引擎在很多方面不能满足人们的需要。Web文档聚类可以减小搜索空间,加快检索速度,提高查询精度。提出了一种融合SOM(Self-Organizing Maps)粗聚类和改进PSO(Particle Swarm Optimization)细聚类的Web文档集成聚类算法。首先根据向量空间模型表示法,用特征词条及其权值表示Web文档信息,其次用SOM算法对文档特征集进行粗聚类,得到一组输出权值,然后用这组权值初始化改进的PSO算法,用改进PSO算法对此聚类结果进行细化,最终实现Web文档聚类。仿真结果表明,该算法能有效提高文档查询的查准率和查全率,具有一定的实用价值。 相似文献
3.
K-means算法因对初始中心依赖性而导致聚类结果可能陷入局部极小.而恰当的选取初始中心向量就成为改进K-means算法的关键所在.因此可以先通过SOM进行聚类,较快确定聚类范围,再将其结果作为K-means方法的初始中心向量加以使用.实验证明结合这两种算法能够弥补这两种方法的缺陷,较好改善聚类效果. 相似文献
4.
5.
一种基于SOM和K-means的文档聚类算法 总被引:9,自引:0,他引:9
提出了一种把自组织特征映射SOM和K-means算法结合的聚类组合算法。先用SOM对文档聚类,然后以SOM的输出权值初始化K-means的聚类中心,再用K—means算法对文档聚类。实验结果表明,该聚类组合算法能改进文档聚类的性能。 相似文献
6.
基于SOM算法的文本聚类实现 总被引:2,自引:0,他引:2
以自组织映射(Self-organizing Map,SOM)算法作为理论基础,实现对文本聚类,并采用U矩阵进行可视化表示。通过对聚类结果的分析,表明SOM算法具有较好的聚类效果。 相似文献
7.
针对粒子群优化(Particle Swarm Optimization,PSO)算法在维度高、特征稀疏的文本聚类过程中,随着算法迭代次数增加在后期陷入局部最优的问题,提出采用多样性更好的差分进化(Differential Evolution,DE)策略更新种群,尝试找到更好的全局最优解.考虑到种群个体间包含的聚类中心向... 相似文献
8.
9.
自组织映射(SOM)聚类算法的研究 总被引:7,自引:0,他引:7
通过自组织映射神经网络实现的聚类算法能将任意维数的输入信号模式转变为一维或二维的离散映射,以拓扑有序的方式自适应实现这个变换.介绍自组织映射聚类算法的原理,通过实验进行仿真,结果表明自组织映射聚类算法是可行有效的. 相似文献
10.
11.
信息时代,文本信息极其巨大。本文运用一种改进GHSOM 算法进行文本聚类,该算法具有显著的文本聚类
能力,能够将文本的相似性用多种手段表现。实验结果表明改进GHSOM 算法整体上是优于SOM 算法,它的先进性主要体现
在更短的计算时间,并提供更丰富的有序性表达能力。 相似文献
12.
13.
传统的K-均值算法,因对初始聚类中心的选择敏感,存在容易陷入局部最优解的缺点,差分演化算法是一类基于种群的启发式全局搜索技术,对于实值参数的优化具有很强的鲁棒性。为了克服K-均值聚类算法的上述缺点,提出基于差分演化的K-均值聚类算法,该方法结合K-均值算法的高效性和差分演化算法的全局优化能力,较好地解决了聚类中心优化问题。通过实验结果表明,此算法能够有效改善聚类质量。 相似文献
14.
15.
压缩感知是基于信号稀疏性提出的采样理论,它在压缩成像、医学图像、雷达成像、天文学、通信等领域都有广泛的应用.压缩感知问题的求解本质上是一个优化问题,本文在微分进化算法的基础上对其改进,提出了一种改进微分进化算法,将其应用于压缩感知问题的求解中,取得了良好的效果. 相似文献
16.
17.
18.
Web文本聚类算法的分析比较 总被引:2,自引:0,他引:2
随着计算机网络的发展,各种文本资源以惊人的速度增长,导致信息搜寻困难和信息利用率低下。而快速高质量的Web文本聚类技术可以满足用户方便快捷地从互联网获得所需要的信息资源。文章对Web文本聚类如网页采集、去噪、分词、特征表示等关键技术进行研究,对常用的Web文本聚类算法进行了分析比较,所给出的分析比较结果对文本聚类算法的应用有现实意义。 相似文献
19.
随着文本资源的激增,特别是网页文本的迅速增加,针对文本的挖掘分析日益受到重视。谱聚类是文本聚类分析较常用的一种新型方法。该文将非负约束引入到传统的谱聚类算法中,提出了一种基于非负约束的谱聚类方法。文中实验验证了所提出方法在中文文本聚类分析应用中的有效性。 相似文献