基于分隔符的中文论坛信息抽取 |
| |
引用本文: | 魏晶晶,于然,廖祥文.基于分隔符的中文论坛信息抽取[J].福建电脑,2011,27(6):4-6,21. |
| |
作者姓名: | 魏晶晶 于然 廖祥文 |
| |
作者单位: | 1. 福建江夏学院电子信息科学系,福建,福州,350108 2. 福州大学数学与计算机科学学院,福建,福州,350108 |
| |
基金项目: | 福建江夏学院青年项目(No.2010C046); 福建省自然科学基金(No.2010J05133); 福州大学科技专项启动基金(No.2010-XQ-22)支持 |
| |
摘 要: | 论坛蕴含丰富的信息资源,如何获取并结构化这些信息被广泛研究。目前有多种信息抽取方法,但因各种方法的处理对象不同,以及中文论坛独有的特点,使得通用抽取方法应用于中文论坛信息抽取并不能取得理想的效果。因此本文在信息抽取方法softmealy的基础上,对中文论坛的特性进行分析,提出基于分隔符的中文论坛信息抽取方法,并以3个被广泛使用的中文论坛数据进行实验。实验结果表明,本方法可取得良好效果。
|
关 键 词: | 信息抽取 论坛 分隔符 softmealy |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|