首页 | 本学科首页   官方微博 | 高级检索  
     

基于TWE-NMF主题模型的Mashup服务聚类方法
引用本文:陆佳炜,赵伟,张元鸣,梁倩卉,肖刚.基于TWE-NMF主题模型的Mashup服务聚类方法[J].软件学报,2023,34(6):2727-2748.
作者姓名:陆佳炜  赵伟  张元鸣  梁倩卉  肖刚
作者单位:中国计量大学 机械电子工程学院, 浙江 杭州 310018;浙江工业大学 计算机科学与技术学院, 浙江 杭州 310023;School of Computer Science and Engineering, Nanyang Technological University, Singapore 637457, Singapore
基金项目:国家自然科学基金(61976193);浙江省自然科学基金(LY19F020034);浙江省重点研发计划(2021C03136)
摘    要:随着互联网和面向服务技术的发展,一种新型的Web应用——Mashup服务,开始在互联网上流行并快速增长.如何在众多Mashup服务中找到高质量的服务,已经成为一个大家关注的热点问题.寻找功能相似的服务并进行聚类,能有效提升服务发现的精度与效率.目前国内外主流方法为挖掘Mashup服务中隐含的功能信息,进一步采用特定聚类算法如K-means等进行聚类.然而Mashup服务文档通常为短文本,基于传统的挖掘算法如LDA无法有效处理短文本,导致聚类效果并不理想.针对这一问题,提出一种基于非负矩阵分解的TWE-NMF (non-negative matrix factorization combining tags and word embedding)模型对Mashup服务进行主题建模.所提方法首先对Mashup服务规范化处理,其次采用一种基于改进的Gibbs采样的狄利克雷过程混合模型,自动估算主题的数量,随后将词嵌入和服务标签等信息与非负矩阵分解相结合,求解Mashup服务主题特征,并通过谱聚类算法将服务聚类.最后,对所提方法的性能进行了综合评价,实验结果表明,与现有的服务聚类方法相比,所提方法在准确率、召回率、F-measure、纯度和熵等评价指标方面都有显著提高.

关 键 词:Mashup服务  非负矩阵分解  主题模型  词嵌入  服务聚类
收稿时间:2020/11/2 0:00:00
修稿时间:2021/1/29 0:00:00

TWE-NMF Topic Model-based Approach for Mashup Service Clustering
LU Jia-Wei,ZHAO Wei,ZHANG Yuan-Ming,LIANG Qian-Hui,XIAO Gang.TWE-NMF Topic Model-based Approach for Mashup Service Clustering[J].Journal of Software,2023,34(6):2727-2748.
Authors:LU Jia-Wei  ZHAO Wei  ZHANG Yuan-Ming  LIANG Qian-Hui  XIAO Gang
Affiliation:School of Mechanical and Electrical Engineering, China Jiliang University, Hangzhou 310018, China;College of Computer Science and Technology, Zhejiang University of Technology, Hangzhou 310023, China;School of Computer Science and Engineering, Nanyang Technological University, Singapore 637457, Singapore
Abstract:
Keywords:Mashup service  non-negative matrix factorization (NMF)  topic model  word embedding  service clustering
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号