首页 | 本学科首页   官方微博 | 高级检索  
     

基于分解与动态规划策略的汉语未登录词识别
引用本文:吕雅娟,赵铁军,杨沐昀,于浩,李生.基于分解与动态规划策略的汉语未登录词识别[J].中文信息学报,2001,15(1):28-33.
作者姓名:吕雅娟  赵铁军  杨沐昀  于浩  李生
作者单位:哈尔滨工业大学计算机科学与技术学院
基金项目:国家 8 63计划! ( 863 -30 6-ZT0 3 -0 6-3 / 863 -30 6-ZD13 -0 4 -4 ),国家自然科学基金! ( 697750 17)
摘    要:未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名,中国地名和外国译名进行整体识别为目标,采用分解处理策略降低了整体处理难度,并使用动态规划方法实现了最佳路径的搜索,较好地解决了未登录词之间的冲突问题。通过对真实语料识别的测试,证明该方法可以全面提高未登录词识别的正确率和召回率。

关 键 词:未登录词识别  分解处理  动态规划  
修稿时间:2000年5月23日

Leveled Unknown Chinese Words Resolution by Dynamic Programming
LV Ya-jan,ZHAO Tie-jun,YANG Mu-yun,YU Hao,LI Sheng.Leveled Unknown Chinese Words Resolution by Dynamic Programming[J].Journal of Chinese Information Processing,2001,15(1):28-33.
Authors:LV Ya-jan  ZHAO Tie-jun  YANG Mu-yun  YU Hao  LI Sheng
Affiliation:School of Computer Science and Technology ,Harbin Institute of Technology
Abstract:Unknown word resolution is a dilemma for automatic Chinese segmentation.Aiming at solving Chinese human names,Chinese place names and translated names of other language,this paper puts forward a leveled unknown word resolution strategy with dynamic programming searching the best path.This method successfully solves the contradictions among these unknown words identification.Experiment on real corpus shows that the proposed method possesses a high performance.
Keywords:unknown word resolution  leveled strategy  dynamic programming
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号