基于半监督图聚类的项目主题模型构建方法 |
| |
作者姓名: | 石林宾 余正涛 严馨 宋海霞 洪旭东 |
| |
作者单位: | 昆明理工大学信息工程与自动化学院 昆明650500 |
| |
基金项目: | 本文受国家自然科学基金(61175068),国家中小企业创新基金(11C26215305905),云南省教育厅基金重大专项项目资助 |
| |
摘 要: | 项目文档主题表征的好坏直接影响后续评审专家的推荐效果.为有效利用项目文档片段之间的关联关系进行项目主题分析,提出一种基于半监督图聚类的项目主题模型构建方法.该方法首先分析项目文档的结构特点,提取项目名称、项目关键字等能表征主题的结构信息,结合专家证据文档、专家主题关系网等能表征专家主题的外部资源,定义及提取项目文档片段之间的关联关系特征;然后,利用不同类型的关联关系计算项目文档片段之间的相关性,构建项目文档片段间的无向图模型;最后,利用已标记关联关系特征作为聚类的监督信息,采用半监督图聚类算法对项目文档片段进行聚类,从而实现项目主题的提取.项目主题提取对比实验结果验证了所提方法的有效性,项目文档结构化特征、专家证据文档以及专家主题关系网对项目主题模型的构建具有一定的指导作用.
|
关 键 词: | 主题模型 半监督图聚类 关联关系特征 评审专家推荐 |
本文献已被 万方数据 等数据库收录! |
|