首页 | 本学科首页   官方微博 | 高级检索  
     

自然语言文本中不确定性信息的自动识别
引用本文:杨文敏,李保利.自然语言文本中不确定性信息的自动识别[J].计算机系统应用,2015,24(2):155-158.
作者姓名:杨文敏  李保利
作者单位:河南工业大学 信息科学与工程学院,郑州,450001
基金项目:河南省基础与前沿技术研究项目(112300410007)
摘    要:自然语言中存在大量不确定的表述,针对此类信息的检测任务是信息抽取领域的研究热点之一,然而,面向中文的不确定信息检测研究仍然比较匮乏,利用支持向量机(Support Vector Machine,SVM)能够很好的解决非线性、高维数、局部小样本等实际问题的优势,将中文不确定性信息识别问题转化为分类问题,通过在复旦大学发布的中文不确定性检测数据集语料上的实验,验证了本文提出的基于SVM的中文不确性信息检测方法的有效性,相比于句子评分模型,我们的系统取得了更好的召回率.

关 键 词:不确定性信息检测  支持向量机  语料  分类
收稿时间:2014/5/20 0:00:00
修稿时间:2014/11/3 0:00:00

Automatic Identification of Uncertainty Information in Natural Language
YANG Wen-Min and LI Bao-Li.Automatic Identification of Uncertainty Information in Natural Language[J].Computer Systems& Applications,2015,24(2):155-158.
Authors:YANG Wen-Min and LI Bao-Li
Affiliation:Henan University of Technology, College of Information Science and Engineering, Zhengzhou 450001, China;Henan University of Technology, College of Information Science and Engineering, Zhengzhou 450001, China
Abstract:There are a lot of uncertainty information in natural Language. It is becoming a focus of researches in NLP recently. However, the research on Chinese is still scarce. In this paper, we use SVM, which is a good solution to the high dimension, nonlinear and local small sample, to identify Chinese uncertainty information recognition as a question of classification. We carry experiment on Chinese uncertainty corpus published by Fudan University, which confirms the availability exposed by our paper based on SVM. Compared to the sentence scoring model, our system has better recall rate.
Keywords:uncertainty information detection  SVM  corpus  classification
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号