首页 | 本学科首页   官方微博 | 高级检索  
     

命名实体的网络话题K-means动态检测方法
引用本文:刘素芹,柴松. 命名实体的网络话题K-means动态检测方法[J]. 智能系统学报, 2010, 5(2): 122-126. DOI: 10.3969/j.issn.1673-4785.2010.02.005
作者姓名:刘素芹  柴松
作者单位:1. 中国石油大学,计算机与通信工程学院,山东,青岛,266555
2. 中国石油大学,计算机与通信工程学院,山东,青岛,266555;山东省军区,自动化工作站,山东,济南,250013
摘    要:针对传统的网络话题检测方法在文本特征表示方面的不足及K-means聚类算法面临的问题,提出了一种基于命名实体的网络话题K-means动态检测方法.该方法对传统话题检测的特征表示方法进行了改进,用命名实体和文本特征词相结合表示文本特征,用命名实体对文本表示的贡献大小表示命名实体的权重;另外,利用自适应技术对K-means聚类算法中的K值进行自收敛,对K-means聚类算法进行了优化,利用K值的动态选取来实现网络话题的动态检测.实验结果表明,该方法较好地区分了相似话题,有效提高了话题检测的性能.

关 键 词:命名实体  网络话题  动态检测  K-means聚类  自相似度  话题向量

K-means dynamic web topic detection method based on named entities
LIU Su-qin,CHAI Song. K-means dynamic web topic detection method based on named entities[J]. CAAL Transactions on Intelligent Systems, 2010, 5(2): 122-126. DOI: 10.3969/j.issn.1673-4785.2010.02.005
Authors:LIU Su-qin  CHAI Song
Abstract:Current text representation models are not suitable for web topic detection,and the traditional K-means clustering algorithm has some drawbacks.The authors developed a dynamic K-means detection algorithm for web topics on the basis of named entities.In the new method,the representation model of the traditional topic detection method was modified.The text was represented by a combination of named entities and text features.The weight of the named entity was described by its contribution to the representation...
Keywords:named entity  web topics  dynamic detection  K-means clustering method  self-similarity  topic vector  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号