首页 | 本学科首页   官方微博 | 高级检索  
     

基于fastText的中文文本分类
引用本文:代令令,蒋 侃.基于fastText的中文文本分类[J].计算机与现代化,2018,0(5):35.
作者姓名:代令令  蒋 侃
基金项目:国家自然科学基金资助项目(71362012)
摘    要:在保证文本分类准确率的情况下缩短分类时间一直是文本分类领域的一个研究目标。针对目前文本分类处理过程复杂且耗时过长的问题,将Facebook开源的句子分类和单词特征学习模型fastText引入到中文文本分类领域中,并验证其在中文分类中的效果。相对于目前主流的文本分类方法,基于fastText模型的分类方法在保证分类效果的同时,大大缩短了分类时间。此外,在分类准确率和参数设置方面进行分析并得出相应的优化规则。

关 键 词:文本分类  fastText    线性分类器    快速文本分类模型  
收稿时间:2018-06-13

Chinese Text Classification Based on fastText
DAI Ling-ling,JIANG Kan.Chinese Text Classification Based on fastText[J].Computer and Modernization,2018,0(5):35.
Authors:DAI Ling-ling  JIANG Kan
Abstract:A goal of text classification is to shorten the classification time under the premise of ensuring the accuracy of classification. In order to solve the problem that the current text classification process is complex and time-consuming, fastText, a library for efficient learning of word representations and sentence classification proposed by Facebook is applied to Chinese text classification field to test its effect. Compared with the mainstream text classification method, fastText can guarantee the classification accuracy and greatly shorten the classification time. At the same time, this paper further studies and analyzes the classification accuracy and parameters and gets some optimization rules.
Keywords:text classification  fastText  linear classifier  fast text classification model  
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号