基于聚类方法对特定领域术语的自动筛选 |
| |
作者姓名: | 李勇 |
| |
作者单位: | 襄樊学院电气信息工程系,湖北,襄樊,441053 |
| |
摘 要: | 从大规模无标注的文本中获取特定领域的术语词典,通常采用的方法是从术语抽取器得到相关术语,而后使用手工的方式进行术语筛选,得到相关领域的术语。这需要大量的人力物力,并且标准无法统一。本文提出了一种利用CBC聚类方法从抽取的术语文本中自动别除非此领域的术语,并且通过对训练语料库文本的不断丰富,还可以对新词进行
识别,以扩大该领域的术语集。最后,通过对实验结果进行评测,显示了CBC聚类方法对术语筛选的良好效果。
|
关 键 词: | CBC聚类方法 术语筛选 语料库 术语抽取 |
文章编号: | 1007-130X(2008)02-0064-03 |
收稿时间: | 2007-10-05 |
修稿时间: | 2007-12-05 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机工程与科学》浏览原始摘要信息 |
|
点击此处可从《计算机工程与科学》下载全文 |
|