首页 | 本学科首页   官方微博 | 高级检索  
     

面向服务聚类的短文本优化主题模型
引用本文:陆佳炜,郑嘉弘,李端倪,徐俊,肖刚.面向服务聚类的短文本优化主题模型[J].浙江大学学报(自然科学版 ),2022,56(12):2416-2425.
作者姓名:陆佳炜  郑嘉弘  李端倪  徐俊  肖刚
作者单位:1. 浙江工业大学 计算机科学与技术学院,浙江 杭州 3100232. 中国计量大学 机电工程学院,浙江 杭州 310018
基金项目:国家自然科学基金资助项目(61976193);国家社会科学基金资助项目(22BMZ038);浙江省自然科学基金资助项目(LY19F020034);浙江省重点研发计划项目(2021C03136)
摘    要:为了获取高质量的隐式主题结果,提高服务聚类精度,解决服务描述文档文本短带来的语义稀疏性与噪声问题,提出词向量与噪声过滤优化的词对主题模型(BTM-VN). 该模型以词对为基础,拓展服务描述文档,获取额外的语义信息,设计利用主题分布信息进行代表词对概率计算的策略,通过在采样过程中计算代表词对矩阵,提高代表词对在当前主题的权重,降低噪声词对服务描述文档主题获取的干扰. 利用词向量筛选待训练的词对集合,减少共现意义低的词对组合,解决词对主题模型耗时较长的问题. 使用优化的密度峰值聚类算法对经BTM-VN训练后的服务主题分布矩阵进行聚类. 实验结果表明,基于BTM-VN的服务聚类方法在3种聚类评价指标上的表现均优于传统的服务聚类算法.

关 键 词:服务聚类  主题模型  短文本优化  代表词对  词向量  

Short text optimized topic model for service clustering
Jia-wei LU,Jia-hong ZHENG,Duan-ni LI,Jun XU,Gang XIAO.Short text optimized topic model for service clustering[J].Journal of Zhejiang University(Engineering Science),2022,56(12):2416-2425.
Authors:Jia-wei LU  Jia-hong ZHENG  Duan-ni LI  Jun XU  Gang XIAO
Abstract:
Keywords:service clustering  topic model  short text optimization  representative biterm  word embedding  
点击此处可从《浙江大学学报(自然科学版 )》浏览原始摘要信息
点击此处可从《浙江大学学报(自然科学版 )》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号