基于个人微博特征的事件提取研究 |
| |
作者单位: | ;1.内蒙古科技大学信息工程学院 |
| |
摘 要: | 个人微博在事件提取上大多都是运用文本进行相似度计算最终达到聚类结果,而没有充分的考虑到微博特征。针对微博标签、URL、时间等特征,提出一种基于微博特征的事件提取算法。该算法针对微博的特征进行TF-IDF的改进,并加入标签相似度,URL相似度,进行综合相似度计算,最后按时间先分段后合并的改进K-means聚类方法得出事件提取结果。实验结果表明,基于微博特征的事件提取算法对微博关键字提取和事件提取的精确度有明显的提高。
|
关 键 词: | 微博特点 事件提取 综合相似度 |
ON EVENTS EXTRACTION BASED ON MICROBLOGGING CHARACTERISTICS |
| |
Abstract: | |
| |
Keywords: | |
|
|