共查询到18条相似文献,搜索用时 93 毫秒
1.
2.
针对如何为构件检索提供更合理的候选构件集问题,设计了一种基于标识潜在语义分析的模糊聚类方法 (TL-SAF)。首先设计了标识提取算法从构件描述文档中提取出构件的标识,然后应用潜在语义分析对标识进行降维并提取潜在语义关系,最后使用模糊聚类的思想对构件进行聚类。TLSAF聚类摆脱了传统聚类的硬划分模式,使构件可以分别隶属于不同的簇,对构件检索将能够提供更好的支持。通过在原型构件库中应用TLSAF对本文方法的可行性与有效性进行了验证。 相似文献
3.
4.
5.
将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足。提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类。在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性。 相似文献
6.
相似文档检索在文档管理中是很重要的,提出一种在大文档集中基于模糊聚类的快速高效的聚类方法,传统方法大都通过词与词之间的比较来检索文档,该方法让文档通过两层结构得出相似度。系统用预定义模糊簇来描述相似文档的特征向量,用这些向量估计相似度,由此得出文档之间的距离,系统应用了新的相似性度量方法,并通过实验证实了其可行性和高效性。 相似文献
7.
针对如何从规模庞大的软件构件库中快速且高效地检索出目标构件的问题,提出一种基于刻面分类标识和聚类树的构件检索方法。使用构件标识集合对构件进行刻面分类标识描述,克服了单纯采用刻面分类法对构件进行分类描述和检索时带来的主观因素的影响;引入聚类树的思想,对构件进行基于语义相似度的聚类分析,建立构件聚类树,能有效地缩小检索范围,减少检索构件与构件库中构件比较的次数,提高检索效率。最后在实验中与一般检索方法对比,实验结果表明该方法的构件查准率为88.3%,查全率为93.1%;而且在大规模的构件库中使用时依然有良好的检索效果。 相似文献
8.
9.
在研究无序树包含匹配的基础上,提出一种新的基于XML的软件构件查询匹配算法.该算法可以在保持较高构件查准率的前提下,显著地提高构件的查全率,并提供对布尔查询的支持.此外,通过合理地设定约束条件以及利用动态规划的方法,将计算查询匹配代价的算法时间复杂度限定为多项式级,确保构件查询具有足够的查询效率.最后,通过在构件库原型系统RCRS上进行的一系列实验,进一步证明了新的查询匹配算法在软件构件查询实际应用中的可行性和有效性. 相似文献
10.
11.
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model, GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。 相似文献
12.
K均值聚类和模拟退火融合的软硬件划分 总被引:1,自引:0,他引:1
文章提出了一种K均值聚类和模拟退火融合的软硬件划分算法。算法首先将有相似属性的任务节点通过K均值聚类算法组成一个大的任务节点,而后使用模拟退火算法划分由大的任务节点组成的系统。通过对比经典的模拟退火软硬件划分技术以及实验结果的验证表明,使用K均值聚类和模拟退火融合的软硬件划分算法使有着较多任务节点的复杂系统的软硬件划分快速收敛到合适的值。 相似文献
13.
软件复用和基于构件的软件开发是软件工程化开发和工业化生产的必然趋势,可复用构件的制作和集成组装是其中涉及的两个重要活动.首先分析了现有的构件集成方式所存在的不足,引出了基于体系结构的构件集成;接着对几种不同的体系结构类型进行比较,阐述了它们对构件集成的影响;然后提出了支持接口连接式和插头插座式体系结构类型的构件模型以及基于体系结构的构件集成组装框架,并给出了构件的制作和组装过程;最后对工作进行总结,并指出了进一步的研究方向. 相似文献
14.
一种基于模拟退火和遗传算法的模糊聚类方法 总被引:3,自引:1,他引:3
首先,对模糊C-均值聚类算法做了简要分析和评论,根据其特点,提出了一种基于模拟退火和遗传算法的聚类分析方法,算法中采用了适合于模糊聚类的树型编码方案。实验表明,该算法可克服系统对数据集及初始聚类中心的敏感性,避免陷入局部极小,在模式识别、数据挖掘等领域有着广泛的应用前景。 相似文献
15.
由于缺少监督数据,传统的基于聚类算法的入侵检测系统存在误报率高、检测率低等问题。针对这种情况,提出基于模拟退火和半监督K均值聚类的入侵检测方法。该方法首先利用少量标记入侵类型的网络数据改进聚类初始化过程,在K均值聚类算法中引入半监督学习,然后利用模拟退火算法跳出局部极值的能力与半监督K均值聚类算法结合以得到全局最优聚类,最后根据标记数据确定聚类类别,并应用于入侵行为的检测。基于KDDCUP99的对比实验表明,该方法利用监督数据和模拟退火算法改进了聚类算法,能够有效提高入侵检测的准确率。 相似文献
16.
17.
白成刚 《计算机工程与应用》2005,41(33):17-19
对软件构件进行分类有助于人们开发高质量的软件。Naive-Bayes网在分类中已经得到成功的应用。但是Naive-Bayes网有一个基本假设:各特征节点要求条件独立。不幸的事,这在现实世界中很难成立。论文利用主成分分析的方法降低了各特征节点的相关性,扩展了Naive-Bayes网的应用范围,并将其用于对软件构件进行分类。实例分析表明新的Bayes分类网预测精度高于一般的Naive-Bayes网。 相似文献