首页 | 本学科首页   官方微博 | 高级检索  
     

中医药古文献语料库设计与开发研究
引用本文:刘耀,段慧明,王惠临,周扬,王振国,李宏展.中医药古文献语料库设计与开发研究[J].中文信息学报,2008,22(4):24-30.
作者姓名:刘耀  段慧明  王惠临  周扬  王振国  李宏展
作者单位:1. 中国科学技术信息研究所,北京 100038; 2. 北京大学 计算语言学研究所,北京 100871;
3. 山东中医药大学 文献研究所,山东 济南 250014
基金项目:国家科技支撑计划 , 国家重点基础研究发展计划(973计划) , 国家社会科学基金 , 山东省中医药科技专项资助项目
摘    要:专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。

关 键 词:计算机应用  中文信息处理  自然语言处理  语料库  中医药古文献  知识工程  

Research on Corpus Creation and Development of Chinese Traditional Medicine
LIU Yao,DUAN Hui-ming,WANG Hui-lin,ZHOU Yang,WANG Zhen-guo,LI Hong-zhan.Research on Corpus Creation and Development of Chinese Traditional Medicine[J].Journal of Chinese Information Processing,2008,22(4):24-30.
Authors:LIU Yao  DUAN Hui-ming  WANG Hui-lin  ZHOU Yang  WANG Zhen-guo  LI Hong-zhan
Affiliation:1. Institute of Scientific and Technical Information of China,Beijing 100038,China;
2. Institute of Computational Linguistics, Peking University, Beijing 100871, China;
3. Institute of Chinese Medical History and Literature,Shandong University of Traditional
Chinese Medicine, Jinan, Shandong 250014,China
Abstract:Domain corpus is essential to the natural language processing for domain documents,especially for its content and intention analysis.Based on the specific research background,this paper first elaborates the necessity and significance of natural language processing for domain documents.After the analysis on the characteristics of the domain corpus,this paper probes into the design strategy and principle of domain corpus construction.Meanwhile, it also investigates into the part of speech tagging in the corpus.Finally a human-aided processing system for domain corpus is developed,providing some theoretical guidance and technique support for domain corpus construction.
Keywords:computer application  Chinese information processing  natural language processing  corpus  Chinese traditional medicine document  knowledge engineering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号