首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
钱晓捷  杜胜浩 《计算机应用》2017,37(10):2973-2977
针对如何从规模庞大的软件构件库中快速且高效地检索出目标构件的问题,提出一种基于刻面分类标识和聚类树的构件检索方法。使用构件标识集合对构件进行刻面分类标识描述,克服了单纯采用刻面分类法对构件进行分类描述和检索时带来的主观因素的影响;引入聚类树的思想,对构件进行基于语义相似度的聚类分析,建立构件聚类树,能有效地缩小检索范围,减少检索构件与构件库中构件比较的次数,提高检索效率。最后在实验中与一般检索方法对比,实验结果表明该方法的构件查准率为88.3%,查全率为93.1%;而且在大规模的构件库中使用时依然有良好的检索效果。  相似文献   

2.
基于XML文档相似性的构件聚类分析   总被引:2,自引:2,他引:0  
构件聚类时,提出了一种计算基于XML描述的构件问相似度的递归算法,能有效度量构件XML描述文档包含的结构和语义信息.构造文档相似矩阵,利用遗传算法将高维样本映射到二维平面上,使用k-means算法聚类,获得全局最优的构件聚类.最后,在构件库测试模型上进行实验,实验结果表明,基于XML相似度的构件聚类算法在构件查询实践中具有可行性和有效性.  相似文献   

3.
论文提出一个基于语义的文本间的相似度算法,以文本的特征词相似度为基础,来计算文本间的相似度,利用聚类算法对文本簇进行聚类.实验结果证明基于知网的文本语义相似度方法在对文本相似度计算以及文本聚类方面,能有效提高聚类的效果.  相似文献   

4.
基于单词相似度的文本聚类   总被引:3,自引:1,他引:3  
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点.针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类.实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果.  相似文献   

5.
设计了一种对基于XML描述的软件构件进行聚类的算法(即基于模拟退火的构件聚类算法),该算法通过模拟金属退火基本原理对构件库中的软件构件聚类进行全局优化.构件聚类时,根据一般意义的树间编辑距离,提出一种用于判断基于XML描述的构件间是否相似的度量测度(称为XML编辑距离).利用XML编辑距离,可将构件间相似性度量的时间复杂度限制在多项式级,且能保持构件的XML描述文档的节点语义信息和节点间的祖孙嵌套关系.最后,在构件库测试模型上进行实验,结果证实了基于模拟退火的构件聚类算法在构件查询实践中的可行性和有效性.  相似文献   

6.
软件构件的ATE表示及其聚类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出一种自动标签提取(ATE)构件表示方法,并设计基于ATE的模糊聚类方法。ATE表示能够包含比刻面分类更多的有效信息,并克服构件刻面分类可能产生的主观因素影响。模糊聚类使构件摆脱传统聚类的硬划分模式,可分别隶属于不同的簇,对构件检索提供更好的支持。在原型构件库中的对比实验证明该方法的可行性与有效性。  相似文献   

7.
针对分类变量相似度定义存在的不足, 提出一种新的相似度定义. 利用新的相似度定义, 将数据集抽象为无向图, 将聚类过程转化为求无向图连通分量的过程, 进而提出一种基于连通分量的分类变量聚类算法. 为了定量地分析该算法的聚类效果, 针对类别归属已知的数据集, 提出一种新的聚类结果评价指标. 实验结果表明, 所提出的算法具有较高的聚类精度和聚类效率.  相似文献   

8.
根据各分布信息源信息单元实体类的语义相似度,对于信息单元实体类进行聚类,是半自动地进行本体映射、构建分布异构信息资源全局视图的重要步骤。本文面向分布信息资源统一信息视图构建需求,利用基于本体的元数据模型及语义相似度,在其基础上定义了语义聚类特征,基于语义聚类特征设计了一种基于语义特征树的混合层次聚类算法SCFBHCA。从理论和实验两个角度对SCFBHCA算法进行了分析,对比HCA和HCP,该算法具有增量式和扩展性且效率更高。  相似文献   

9.
针对标题文本聚类中的聚类结果不稳定问题,提出一种基于聚类融合的标题文本聚类方法。该方法对标题文本的特征词进行筛选,将标题文本转化为特征词集合;提出基于统计和语义的相似度计算方法,计算特征词集合间的相似度;引入基于共协矩阵的聚类融合算法,得出聚类结果。实验结果表明,和传统聚类算法相比,该方法提升了标题文本聚类的稳定性。  相似文献   

10.
基于等级策略的构件聚类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
构件库系统需解决两个核心问题:构件的分类表示与构件的检索,其中对构件的合理分类是实现构件高效检索的基础和前提。针对目前常用的刻面分类表示法存在的人为主观因素,采用了刻面分类表示与正文检索相结合的方法对构件进行描述,并依据用户的需求对刻面分类方案中的主刻面赋予不同的等级。提出了一种基于等级策略的构件聚类方法对构件进行聚类分析,并通过实验验证了该方法是有效的,实现了对构件更合理的分类,提高了构件检索的效率和准确性。  相似文献   

11.
为了消除自然语言对构件文本信息描述的二义性以及增强术语间的语义关系,文中采用领域本体的思想,给出了一个基于人工智能领域本体的软件构件聚类模型和基于该模型的聚类算法。该模型通过分析领域的共同概念,形成领域本体知识库,提供领域内一致认可的术语,用于匹配对构件文本描述所使用的自然语言。给出的算法通过与基于传统空间向量的K—Means算法分析比较,验证了该算法是有效的,实现了对软件构件更合理的聚类,提高了构件检索的效率和准确性。  相似文献   

12.
构件的合理分类是实现构件高效检索的基础和关键。针对目前应用广泛的刻面分类方法存在主观性因素的弊端,采用刻面分类和全文检索相结合的方法来描述构件。在此构件描述的基础上,利用聚类分析技术和语义分析技术提出一种基于语义的构件聚类索引树。并通过实验验证,该聚类索引树是可行的,有效地克服刻面分类方法的缺点,在一定程度上实现对构件的语义检索,而且具有较高的构件查全率和查准率。此外,用户在描述检索条件时,不再局限于限定的术语,更方便于普通用户。  相似文献   

13.
面向领域特征聚类的构件组装优化方法   总被引:3,自引:1,他引:2       下载免费PDF全文
Internet环境的开放、动态和难控等特点,使网构软件的构件组装问题变得十分复杂。提出了一种面向领域特征聚类的构件组装优化方法。通过引入本体分类和相似度比较方法,设计了一种基于划分的聚类算法,以实现基于领域特征的精确的构件聚类。通过对构件和链路的多维QoS指标的换算,给出了应用动态规划方法求解面向领域特征簇的构件组装全局最优解的算法实现。算法分析和实验仿真表明了该方法的有效性和可行性。  相似文献   

14.
安全生产事故的分析对应急管理能力提升具有重要意义.通过对安全生产案例的语义分析,利用Word2Vec词嵌入技术和聚类模型,选用CBOW+负采样技术实现词向量,并结合安全生产事故案例分类的数据特点,通过基于半监督学习的聚类模型算法,根据事故性质的认定特点,提出了一种优化初始聚类中心的算法,并利用K-means聚类算法实现安全事故文本案例的分类.实验表明该方法较好实现安全生产的事故案例分类,并对安全生产事故的多个维度分析具有很好借鉴意义.  相似文献   

15.
智能答疑系统中基于聚类的问题分类研究   总被引:3,自引:0,他引:3  
研究了智能答疑系统中的问题分类。针对基于章节目录的分类方式过于依赖特定教材的不足,提出了基于关键词聚类的问题模糊分类方法。此方法基于关键词的语义,采用NERF算法对关键词进行聚类。并利用聚类有效性的方法来弥补此算法过于依赖初始值的不足。最后通过实例进行分析,说明此分类方法的可行性和对基于章节目录的分类方式不足的弥补。  相似文献   

16.
杨迪  徐文瑜  王鹏 《计算机应用研究》2023,40(12):3578-3583
城市路网的合理划分对于优化区域交通控制以及协调策略的实施具有重要意义。为提高道路通行效率,提出基于密度峰值聚类算法的城市路网划分方法,首先,综合考虑交叉口静态和动态因素的影响,构建相邻交叉口的关联度模型,为合理量化交叉口之间的关联程度提供定量描述。其次,提出改进的密度峰值聚类算法,结合相邻交叉口之间的关联度对路网区域进行划分。针对密度峰值聚类算法中局部密度在不同规模数据集上差异较大的问题,引入KNN的思想,重新对局部密度进行描述,其次为避免算法聚类中心人工选取的主观性导致的误差问题,采用肘部法则实现聚类中心的自动选取。实验结果表明,与改进的Newman算法及Ncut算法相比,提出的改进算法在优化子区平均匀质度上可分别降低12.5%和22.8%,提高了控制子区的划分效果,使区域划分效果更合理。  相似文献   

17.
张群  王红军  王伦文 《计算机科学》2016,43(Z11):443-446, 450
短文本因具有特征信息不足且高维稀疏等特点,使得传统文本聚类算法应用于短文本聚类任务时性能有限。针对上述情况,提出一种结合上下文语义的短文本聚类算法。首先借鉴社会网络分析领域的中心性和权威性思想设计了一种结合上下文语义的特征词权重计算方法,在此基础上构建词条-文本矩阵;然后对该矩阵进行奇异值分解,进一步将原始特征词空间映射到低维的潜在语义空间;最后通过改进的K-means聚类算法在低维潜在语义空间完成短文本聚类。实验结果表明,与传统的基于词频及逆向文档频权重的文本聚类算法相比,该算法能有效改善短文本特征不足及高维稀疏性,提高了短文的本聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号