首页 | 本学科首页   官方微博 | 高级检索  
     

基于边界增强的中文直播弹幕新词发现
引用本文:王雪瑞,刘渊. 基于边界增强的中文直播弹幕新词发现[J]. 传感器与微系统, 2018, 0(7): 142-146,150. DOI: 10.13873/J.1000-9787(2018)07-0142-05
作者姓名:王雪瑞  刘渊
作者单位:江南大学数字媒体学院,江苏无锡,214122
基金项目:国家科技支撑计划资助项目(2015BAH54F00),国家自然科学基金资助项目(61672264),国家重点研发计划资助项目(2016YFB0800305)
摘    要:针对中文直播语料具有长度简短、用语不规范、字母数字混杂等特点,使得通常的新词发现方法效果不佳的问题,在现有基于词内部结合度与边界自由度的无监督新词发现算法基础上,引入了边界增强上下文熵的概念,使其适用于通常出现于句子片段边界位置的词语.在某知名直播平台的弹幕语料上进行了实验,结果表明:方法模型简洁,可有效提取新词,并能够通过调整参数适应不同规模的语料输入,且时空复杂度与执行性能良好.

关 键 词:直播弹幕  新词发现  内部结合度  互信息  边界自由度  边界增强上下文熵

Chinese live-streaming danmaku new word detection based on boundary boosting
WANG Xue-rui,LIU Yuan. Chinese live-streaming danmaku new word detection based on boundary boosting[J]. Transducer and Microsystem Technology, 2018, 0(7): 142-146,150. DOI: 10.13873/J.1000-9787(2018)07-0142-05
Authors:WANG Xue-rui  LIU Yuan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号