首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于文本信息的三层过滤系统的设计
作者姓名:胡柳  周立前  黄丽君
作者单位:湖南工业大学计算机与通信学院
基金项目:湖南省国际合作基金项目(2011WK3032)
摘    要:为了提高文本信息过滤的效率,提出一种基于文本信息的三层过滤系统。系统分为横向二部分、纵向三层次的结构,在信息过滤时第一层采用基于IP、URL地址的过滤方式;第二层为关键词频与权重的统计,对信息标题、关键词及正文内容三部分分别计算统计值;第三层为内容特征分析过滤,同时引入分词、关键词权重计算、VSM与主题倾向分析技术,保证不良信息识别的高效与准确。实验表明系统具有较好的过滤效果,查全率和查准率明显优于KNN方法,在实时信息过滤时能及时阻止不良信息的传播。

关 键 词:文本信息  三层过滤  向量空间模型  主题倾向
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号