首页 | 本学科首页   官方微博 | 高级检索  
     

基于互信息的中文术语抽取系统
引用本文:张锋,许云,侯艳,樊孝忠. 基于互信息的中文术语抽取系统[J]. 计算机应用研究, 2005, 22(5): 72-73
作者姓名:张锋  许云  侯艳  樊孝忠
作者单位:1. 北京理工大学,计算机科学与工程系,北京,100081
2. 广东工业大学,计算中心,广东,广州,510520
摘    要:介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本词,并利用普通词语搭配前缀、后缀信息进一步过滤;最后对术语候选进行词法分析,利用术语的词性构成规则进行判别,得到最终的术语抽取结果。实验结果表明,术语抽取正确率为72.19%,召回率为77.98%,F测量为74.97%。

关 键 词:术语抽取;互信息;语料
文章编号:1001-3695(2005)05-0072-02

Chinese Term Extraction System Based on Mutual Information
ZHANG Feng,XU Yun,HOU Yan,FAN Xiao-zhong. Chinese Term Extraction System Based on Mutual Information[J]. Application Research of Computers, 2005, 22(5): 72-73
Authors:ZHANG Feng  XU Yun  HOU Yan  FAN Xiao-zhong
Abstract:
Keywords:Term Extraction  Mutual Information  Corpus
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号