首页 | 本学科首页   官方微博 | 高级检索  
     

从搭配知识获取最优种子的词义消歧方法
引用本文:全昌勤,何婷婷,姬东鸿,刘辉.从搭配知识获取最优种子的词义消歧方法[J].中文信息学报,2005,19(1):31-36.
作者姓名:全昌勤  何婷婷  姬东鸿  刘辉
作者单位:1. 华中师范大学计算机科学与技术系,湖北武汉 430079 ; 2. 新加坡国家科技局信息科学研究院,新加坡 119613 ;3. 华中师范大学生命科学学院,湖北武汉 430079
基金项目:国家自然科学基金,国家语委语言文字应用研究科研规划项目
摘    要:基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识,但人工获取质量较好的初始搭配是比较困难的,并且无法保证有效的扩大搭配知识。针对该问题,提出了通过机器学习初始搭配实例获取最优种子,再由最优种子扩增更多指示词,最后利用这些指示词实现具有多个义项的多义词消歧。采用该方法对8 个多义词进行消歧的测试实验中取得了8717 %的平均正确率。

关 键 词:人工智能  自然语言处理  自然语言处理  词义消歧  搭配  种子优选  
文章编号:1003-0077(2005)01-0030-06
修稿时间:2004年5月10日

Chinese WSD Based on Selecting the Best Seeds from Collocations
QUAN Chang-qin,HE Ting-ting,JI Dong-hong,LIU Hui.Chinese WSD Based on Selecting the Best Seeds from Collocations[J].Journal of Chinese Information Processing,2005,19(1):31-36.
Authors:QUAN Chang-qin  HE Ting-ting  JI Dong-hong  LIU Hui
Affiliation:1.Department of Computer Science and Technology Central China Normal University , Wuhan , Hubei 430079 , China ;2.Institute for Infocomm Research , Heng Mui Keng Terrace , 21 , 119613 , Singapore ;3.Department of Biology , Central China Normal University , Wuhan , Hubei 430079 , China
Abstract:The key problem of word sense disambiguation based on statistic model lies in how to acquiring the word sense indicators automatically. Although it is feasible to acquire a large number of collocations by learning examples, it is hard to select good seeds manually to increase new collocations effectively. The method of selecting the best seeds by machine learning is provided in this paper to solve this problem. The best seeds are used to augment more new word sense indicators; finally disambiguate polysemous words with the acquired indicators. The average accuracy is 87.7% for 8 polysemous words by this method.
Keywords:artificial intelligence  natural language processing  natural language processing  word sense disambiguation  collocation  select seeds
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号