首页 | 本学科首页   官方微博 | 高级检索  
     

面向层次分类标签的词性标注系统
引用本文:潘炜,沈超. 面向层次分类标签的词性标注系统[J]. 计算机工程, 2009, 35(21): 197-199
作者姓名:潘炜  沈超
作者单位:复旦大学讨算机科学与工程系,上海,200433;复旦大学讨算机科学与工程系,上海,200433
摘    要:网络的发展导致大量不规则短语文本的产生,针对现有词性标注工具在层次分类体系标签语料上性能不佳的问题,提出一种基于最大熵的简单算法。引入一个新标记,结合从Wordnet和维基百科提取的2类特征,使性能得到提升。实验结果表明,系统在DMoz上的准确率达到93.77%。

关 键 词:层次分类标签  词性标注  最大熵模型
修稿时间: 

POS Tagging System on Hierachical Classification Labels
PAN Wei,SHEN Chao. POS Tagging System on Hierachical Classification Labels[J]. Computer Engineering, 2009, 35(21): 197-199
Authors:PAN Wei  SHEN Chao
Affiliation:(Department of Computer Science and Engineering, Fudan University, Shanghai 200433)
Abstract:The development of Internet gives birth to many unconventional datasets like hierarchical classification labels. Current Part Of Speech(POS) tagging tools fail on these datasets. To solve this problem, this paper proposes a simple method using Max Entropy Model(MEM) framework, which introduces a new tag and two new features extracted from Wordnet and Wikipedia, and comes up with a significant improvement. Experimental results show that the precision reaches 93.77% on DMoz.
Keywords:hierarchical classification labels  Part Of Specch(POS) tagging  Max Entropy ModeI(MEM)
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号