首页 | 本学科首页   官方微博 | 高级检索  
     

中文金融新闻中公司名的识别
引用本文:王宁,葛瑞芳,苑春法,黄锦辉,李文捷. 中文金融新闻中公司名的识别[J]. 中文信息学报, 2002, 16(2): 1-6
作者姓名:王宁  葛瑞芳  苑春法  黄锦辉  李文捷
作者单位:1.智能技术与系统国家重点实验室,清华大学计算机科学与技术系2.香港中文大学系统工程与工程管理系3.香港理工大学电子计算学系
基金项目:国家自然科学基金(6 9975 0 0 8),国家重点基础研究 973(G19980 30 5 0 7)项目支持
摘    要:在金融领域信息抽取中,公司名扮演着非常重要的角色;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上,总结出了公司名的结构特征及其上下文信息,建立了六个用于识别公司名的知识库,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明,在封闭测试中实验系统公司名识别的精确率可以达到97.3% ,召回率可达89.3%;在开放测试中精确率可以达到62.8% ,召回率可达62.1%。

关 键 词:公司名  金融领域  专名识别  信息抽取  
修稿时间:2001-11-20

Company Name Identification in Chinese Financial Domain
WANG Ning GE Rui fang YUAN Chun fa K.F.Wong LI Wen jie. Company Name Identification in Chinese Financial Domain[J]. Journal of Chinese Information Processing, 2002, 16(2): 1-6
Authors:WANG Ning GE Rui fang YUAN Chun fa K.F.Wong LI Wen jie
Affiliation:1.State Key Laboratory of Intelligent Technology and System, Dept. of Computer Science & Technology, Tsinghua University2.Dept. of System Engineering & Engineering Management, The Chinese University of Hong Kong3.Department of Computing, The Hong Kong Polytechnic University
Abstract:Identifying company names in running texts plays a significant role in financial information extraction.Based on the thoroughly investigations of financial articles,the relevant structural features and contextual constraints were obtained.In this paper,a company name identification system is proposed,which is built on the six knowledge bases and a twice scan method.The experiment achieved 97 3% precision and 89 3% recall respectively by close test,and 62 8% precision and 62 1% recall respectively by open test.
Keywords:company name  financial domain  named entity identification  information extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号