首页 | 本学科首页   官方微博 | 高级检索  
     

基于URL的中文多语义名词在线语义标注
引用本文:刘一正,杨静,李强.基于URL的中文多语义名词在线语义标注[J].计算机工程,2014(10).
作者姓名:刘一正  杨静  李强
作者单位:华东师范大学计算机科学技术系,上海,200241
基金项目:上海市国际科技合作基金资助项目,上海市科委科研基金资助项目“面向NGB的智能业务分析关键技术研究及系统研制”(12dz1500205)。
摘    要:中文语义标注在自然语言处理领域有广泛的应用,其目的在于挖掘并标注出中文多语义名词的多个语义。提出一种新颖的语义标注算法,通过在线URL分类目录,构建得到URL分类器。借助于URL分类器,对搜索引擎返回的多语义名词的搜索结果(包括网页URL及摘要)进行分类,得到多语义名词的初始语义分类结果。对初始语义分类结果按其网页摘要聚类,提取聚类特征后得到多语义词的语义标注结果。该算法利用基于URL的网页分类方法,能在线对中文多语义名词进行语义标注。实验结果证明,该语义标注算法可以取得70%的准确率及80%的召回率,适用于网络热词语义标注。

关 键 词:语义标注  自然语言处理  中文多语义名词  URL分类器  文本聚类  热词

Online Semantic Annotation of Chinese Multi-semantic Nouns Based on URL
LIU Yi-zheng,YANG Jing,LI Qiang.Online Semantic Annotation of Chinese Multi-semantic Nouns Based on URL[J].Computer Engineering,2014(10).
Authors:LIU Yi-zheng  YANG Jing  LI Qiang
Abstract:
Keywords:semantic annotation  natural language processing  Chinese multi-semantic noun  URL classifier  text clustering  hot word
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号