首页 | 本学科首页   官方微博 | 高级检索  
     

基于分隔符的中文论坛信息抽取
引用本文:魏晶晶,于然,廖祥文.基于分隔符的中文论坛信息抽取[J].福建电脑,2011,27(6):4-6,21.
作者姓名:魏晶晶  于然  廖祥文
作者单位:1. 福建江夏学院电子信息科学系,福建,福州,350108
2. 福州大学数学与计算机科学学院,福建,福州,350108
基金项目:福建江夏学院青年项目(No.2010C046); 福建省自然科学基金(No.2010J05133); 福州大学科技专项启动基金(No.2010-XQ-22)支持
摘    要:论坛蕴含丰富的信息资源,如何获取并结构化这些信息被广泛研究。目前有多种信息抽取方法,但因各种方法的处理对象不同,以及中文论坛独有的特点,使得通用抽取方法应用于中文论坛信息抽取并不能取得理想的效果。因此本文在信息抽取方法softmealy的基础上,对中文论坛的特性进行分析,提出基于分隔符的中文论坛信息抽取方法,并以3个被广泛使用的中文论坛数据进行实验。实验结果表明,本方法可取得良好效果。

关 键 词:信息抽取  论坛  分隔符  softmealy
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号