首页 | 本学科首页   官方微博 | 高级检索  
     

基于《知网》的中文信息结构抽取研究
引用本文:尤昉,李涓子,王作英.基于《知网》的中文信息结构抽取研究[J].计算机工程与应用,2002,38(18):56-58.
作者姓名:尤昉  李涓子  王作英
作者单位:1. 清华大学电子工程系,北京,100084
2. 清华大学计算机科学与技术系,北京,100084
基金项目:国家863高技术研究发展计划项目(编号:863-306-ZD03-02-1),985重大项目“人机自然语言交互技术”(编号:985校-22-攻关-06)资助
摘    要:文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。

关 键 词:知网  中文信息结构  部分依存分析器  规则

An Approach Based HowNet for Extracting Chinese Message Structure
You Fang,Li Juanzi,Wang Zuoying.An Approach Based HowNet for Extracting Chinese Message Structure[J].Computer Engineering and Applications,2002,38(18):56-58.
Authors:You Fang  Li Juanzi  Wang Zuoying
Affiliation:You Fang 1 Li Juanzi 2 Wang Zuoying 11
Abstract:
Keywords:HowNet  Chinese Message Structure(CMS )  partial dependency parser  rule  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号