首页 | 本学科首页   官方微博 | 高级检索  
     

基于无监督学习的问答模式抽取技术
引用本文:吴友政,赵军,徐波.基于无监督学习的问答模式抽取技术[J].中文信息学报,2007,21(2):69-76.
作者姓名:吴友政  赵军  徐波
作者单位:中国科学院 自动化研究所 模式识别国家重点实验室, 北京 100080)
基金项目:国家自然科学基金;北京市自然科学基金
摘    要:本文提出了一种基于无监督学习算法的问答模式抽取技术从互联网上抽取应用于汉语问答系统的答案模式。该算法可以避免有监督学习算法的不足,它无需用户提供<提问,答案>对作为训练集,只需用户提供每种提问类型两个或以上的提问实例,算法即可通过Web检索、主题划分、模式提取、垂直聚类和水平聚类等步骤完成该类型提问的答案模式的学习。实验结果表明,论文提出的无监督问答模式学习方法是有效的,基于模式匹配的答案抽取技术能够较大幅度地提高汉语问答系统的性能。

关 键 词:人工智能  自然语言处理  汉语问答系统  问答模式  机器学习  
文章编号:1003-0077(2007)02-0069-08
收稿时间:2006-04-05
修稿时间:2006-07-03

Unsupervised Answer Pattern Acquisition
WU You-zheng,ZHAO Jun,XU Bo.Unsupervised Answer Pattern Acquisition[J].Journal of Chinese Information Processing,2007,21(2):69-76.
Authors:WU You-zheng  ZHAO Jun  XU Bo
Affiliation:National Lab of Pattern Recognition, Institute of Automation, CAS, Beijing 100080, China
Abstract:The paper presents an unsupervised learning algorithm to learn answer pattern for answer extraction module of Chinese Question Answering (QA). Given two or more questions of one question type, the algorithm can learn the corresponding answer patterns from internet via web search, topic segmentation, pattern extraction, vertical clustering and horizontal clustering, etc. The experimental results show that the performance of pattern-based answer extraction of Chinese QA is improved significantly.
Keywords:artificial intelligence  natural language processing  Chinese question answering  answer pattern  machine learning
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号