首页 | 本学科首页   官方微博 | 高级检索  
     

基于分布的中文词表示研究
引用本文:曹学飞,李济洪,王瑞波.基于分布的中文词表示研究[J].计算机应用研究,2019,36(3).
作者姓名:曹学飞  李济洪  王瑞波
作者单位:山西大学软件学院,太原,030006;山西大学软件学院,太原,030006;山西大学软件学院,太原,030006
基金项目:国家社会科学规划基金资助项目(16BTJ034)
摘    要:针对基于分布的中文词表示构造过程中的参数选择问题进行了系统性的研究。选择了六种参数进行对比实验,在中文语义相似度任务上对不同参数设置下得到的中文词表示的质量进行了评估。实验结果表明,通过选择合适的参数,基于分布的词表示在中文语义相似度任务上能够得到较高的性能,而且,这种高维的词分布表示的质量甚至优于目前流行的基于神经网络(Skip-gram)或矩阵分解(GloVe)得到的低维的词表示。

关 键 词:分布表示  语义相似度  逐点互信息
收稿时间:2017/9/12 0:00:00
修稿时间:2019/1/30 0:00:00

Study of distributional representation of Chinese words
Cao Xuefei,Li Jihong and Wang Ruibo.Study of distributional representation of Chinese words[J].Application Research of Computers,2019,36(3).
Authors:Cao Xuefei  Li Jihong and Wang Ruibo
Affiliation:School of software,Shanxi University,,
Abstract:To solve the problem of parameters selection in the process of constructing the distributional representations of Chinese words, this paper performed a systematic study. Six kinds of parameters were selected for comparison experiments, and the quality of the distributional representations of Chinese words obtained under different parameter settings was evaluated on the Chinese semantic similarity task. The experimental results show that, by choosing appropriate parameters, the distributional representations of Chinese words can also get higher performance on the similarity task, Moreover, the quality of such high-dimensional distributional representations is even superior to low-dimensional word representations based on neural network or matrix factorization.
Keywords:distributional representation  semantic similarity  pointwise mutual information
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号