首页 | 本学科首页   官方微博 | 高级检索  
     

汉语句群领域的自动抽取研究
作者姓名:韦向峰  缪建明  张全
作者单位:中国科学院,声学研究所,北京,100190;中国科学院,声学研究所,北京,100190;中国科学院,声学研究所,北京,100190
基金项目:国家重点基础研究发展规划(973计划),国家科技支撑计划,中国科学院声学所知识创新工程项目 
摘    要:句群是介于句子和段落之间的一个处理单位。在语言概念空间句群有三个要素:领域、情景和背景,领域是最根本的。获取了句群领域,就能够确定情景框架,这对信息抽取和文本分类都是非常重要的。一些词语的概念符号中蕴含了领域信息,通过分析词语在句子中的语义角色以及词语位置、频次等可以得到句子的领域。根据领域关系可以合并领域相同或相似的句子,得到句群及其领域。实验表明,常见的四种领域关系能够很好地被处理,但在动态词处理、复合领域的识别等方面还需要改进。

关 键 词:句群  领域  概念层次网络理论  信息抽取  文本分类
收稿时间:2008-10-06
修稿时间:2008-11-18  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号