排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
微博文本简短、信息量少且语法随意,传统主题分类并不理想.Labeled LDA在LDA主题模型上附加类别标签协同计算隐含主题分配量使文本分类效果有所改进,但标签在处理隐式微博或主题频率相近的分类上,存在一定的模糊分配.本文提出的Union Labeled LDA模型通过引入评论转发信息丰富Label标签,进一步提升标签监督下的主题词频强度,一定程度上显化隐式微博、优化同频分配,采用吉布斯采样的方法求解模型.在真实数据集上的实验表明,Union Labeled LDA模型能更有效地对微博进行主题挖掘. 相似文献
2.
针对话题跟踪的任务是从时序新闻报道流中实时识别和挖掘相关于特定新闻话题的报道,本文提出一种事件-时间关联模型(Event-Time Relation Model,ETRM)用来展开话题跟踪研究.ETRM将相关报道的时间属性引入向量空间模型,话题跟踪过程中将话题与相关报道相同特征项的时间相关度应用于相关性判定机制,同时基于时间的分布属性调整特征向量的权重分配,实现话题模型的自适应学习更新.实验采用DET曲线评测系统性能,结果显示相比于传统的话题模型,ETRM能够更加准确地追踪到话题焦点演化趋势,有效提高了话题跟踪系统的性能. 相似文献
1