首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 515 毫秒
1.
黄媛  李兵  何鹏  熊伟 《计算机科学》2013,40(2):167-171
聚类Web服务能大大提高W c6服务搜索引擎检索相关服务的能力。ProgrammablcWeb. com是一个很流行 的在线社会Mashup网站。作为基于Web的应用程序,Mashup本质上是开发者提供的Web服务。结合Mashup服 务的描述文档和相应标签提出一种新颖的Mashup服务聚类的方法,此外还提出一种标签推荐的方法来改进服务聚 类的性能。实验结果表明,基于标签推荐的服务聚类方法的聚类精度比其他两种实验方法要高,说明提出的标签推荐 策略有效扩充了标签数较少的Mashup服务,从而带来更多相关标签信息,因而聚类效果更好。  相似文献   

2.
针对传统Mashup服务推荐算法在关键字聚合搜索和网络构建等方式中计算复杂度过高的问题,提出一种基于语义标签的植入引导式层次聚类Mashup服务推荐算法。首先,为提高聚类算法的收敛精度,提高算法运行效率来满足大型数据搜索对算法简化的需求,采用数据预处理和植入易于获取具有代表性的样本数据对聚类进行引导,防止层次聚类算法顶层集分类失败导致的算法聚类失败。其次,利用改进的聚类算法结合实际的Mashup服务数据库,设计了植入引导式层次聚类Mashup服务推荐算法。最后,通过通过仿真对比表明,基于语义的植入式半监督层次聚类Mashup服务推荐算法的精度要好于对比算法,验证所提算法的有效性。  相似文献   

3.
陆佳炜  赵伟  张元鸣  梁倩卉  肖刚 《软件学报》2023,34(6):2727-2748
随着互联网和面向服务技术的发展,一种新型的Web应用——Mashup服务,开始在互联网上流行并快速增长.如何在众多Mashup服务中找到高质量的服务,已经成为一个大家关注的热点问题.寻找功能相似的服务并进行聚类,能有效提升服务发现的精度与效率.目前国内外主流方法为挖掘Mashup服务中隐含的功能信息,进一步采用特定聚类算法如K-means等进行聚类.然而Mashup服务文档通常为短文本,基于传统的挖掘算法如LDA无法有效处理短文本,导致聚类效果并不理想.针对这一问题,提出一种基于非负矩阵分解的TWE-NMF (non-negative matrix factorization combining tags and word embedding)模型对Mashup服务进行主题建模.所提方法首先对Mashup服务规范化处理,其次采用一种基于改进的Gibbs采样的狄利克雷过程混合模型,自动估算主题的数量,随后将词嵌入和服务标签等信息与非负矩阵分解相结合,求解Mashup服务主题特征,并通过谱聚类算法将服务聚类.最后,对所提方法的性能进行了综合评价,实验结果表明,与现有的服务聚类方法相比,所提方法在准确率、召回率、F-measure、纯度和熵等评价指标方面都有显著提高.  相似文献   

4.
随着Web服务技术的快速发展,Mashup的数量和多样性呈快速增长趋势.有效地管理Mashup服务资源和选取合适的Mashup,成为当今面临的一个重要挑战.鉴于此,提出了一种融合文档和标签的多层网络主题模型Mashup服务聚类方法.该模型对描述文本和标签进行融合,挖掘融合后信息的隐含主题,根据Mashup相似性构建相似...  相似文献   

5.
对用户信息需求自动处理方法的研究是信息系统研究领域的重点之一,其中信息过滤系统的目标就是能够快速准确的从海量文本信息中挖掘出符合用户定制或者查询需求的信息.针对目前文本信息特征向量维数太高并且语义重复性较大的缺点,给出一种对信息过滤系统实现的语义扩展模型,其主要方法是在系统中选取适当规模的概念集合,利用其代替关键词集合来计算得到系统中文本信息的特征向量,通过计算实现文本信息的聚类,然后基于系统的语义关联信息将各个聚类实现基于分层P2P架构的组织.试验证明,文中的语义扩展模型有效实现海量动态信息数据的高效组织和检索,改善系统相关性能.  相似文献   

6.
在社会网络中,标签聚类研究可以解决标签冗余和语义模糊等问题。为了提高聚类有效性,提出综合标签共现信息确定标签特征向量,通过特征向量的提取计算相似度,将传统聚类算法中用几何距离计算对象与中心对象的距离改为用皮尔森相关系数计算,提出结合K-means聚类算法对标签进行聚类的标签共现聚类算法,并分析了算法的复杂度。最后对不同聚类算法进行了相关对比实验,实验结果表明该聚类算法效果要好于其他的聚类算法,从而验证了该聚类算法的有效性和可行性。  相似文献   

7.
王洁  于颜硕  周宽久  侯刚 《计算机科学》2014,41(12):197-201
Web标签有助于用户根据自己特定的兴趣完成信息资源的分类、组织和检索。然而,正是由于协同标记系统特有的公开性、自由化的特点,采用其对信息资源进行描述、组织、分类和检索,存在着信息描述不精确、标签组织混乱和标签语意模糊等问题。在此背景下提出了3种基于特征向量表示法(FVR)的Web标签SOINN聚类算法:基于资源的特征向量表示法、基于其他共现标签的特征向量表示法和基于全集共现标签的特征向量表示法。同时应用MapReduce框架将SOINN算法进行并行化。实验表明,当类中心数量超过2000时,3种分布式聚类FVR算法的召回率和准确度优于原始算法,可获得很好的加速比。从而证明此分布式聚类算法具有很好的可扩展性,可以用于更为海量的Web日志聚类分析系统。  相似文献   

8.
针对现有的基于本体描述的语义Web服务发现方法发现效率较为低下的问题,提出一种新的服务发现方法.该方法在基于本体距离计算语义Web服务综合相似度的基础上,利用数据挖掘中的聚类算法AGNES对语义Web服务集合进行聚类预处理,形成若干服务簇,然后应用相应服务发现算法根据相似度阈值定位于某一服务簇内进行查找匹配,从而可减少搜索空间.理论与仿真实验结果表明,该方法既可保证服务发现的准确率,又可明显提高服务发现的效率.  相似文献   

9.
随着网络技术不断飞速发展,人们的信息需求也随之增长.用户不再满足基于关键字的检索,而是希望网络能够实现以用户所关心的信息为中心、以用户需求为导向,将所有与中心相关的信息全部汇聚起来,也就是实现语义关联聚焦服务.所以针对语义关联聚焦服务需求,提出构建一种包含语义关联关系的语义覆盖网的方法,即首先将网络节点按照语义相似度组织成聚类,然后计算节点的语义关联度,最后根据语义关联度在聚类之间添加关联链接,最终形成各网络节点的关联语义覆盖网络.  相似文献   

10.
针对基于DHT的结构化服务发现方法不支持模糊查找的问题,采用服务聚类技术与结构化服务发现技术相结合的方式,提出了一种基于Bloom filter聚类优化的结构化Web服务发现方法。该方法利用Bloom filter实现服务语义映射并通过服务训练队列实现服务描述聚类特征向量的提取,利用相关性计算实现服务描述的预分类,利用Chord算法实现服务的发布/发现,无需冗余发布,既可保证服务语义相近的服务发布到相同的节点上,又可有效地支持服务的模糊查找,并在此基础之上提出了一种基于Bloom filter的分布式服务组合算法。最后,通过仿真验证了所提方法的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号