首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对游戏客服场景中玩家领域化、口语化的提问方式,应用深度学习工具word2vec建立带有语义的词的向量表示,设计了一种利用词向量距离,结合同义词替换、权重、句子长度、词序等因素的句子相似度计算模型。在该模型基础上,通过预分类、重定义分类规则,对KNN分类算法的大类占优、全局匹配计算代价高等问题进行改进,实现了一种基于文本分类的面向游戏客服场景的自动问答系统。实验结果表明,该系统具有较高的问题分类准确率和分类效率。  相似文献   

2.
面向问答型评论的情感分类在情感分析领域是一项新颖且极具挑战性的研究任务。由于问答型评论情感分类标注数据非常匮乏,基于监督学习的情感分类方法的性能有一定限制。为了解决上述困境,该文提出了一种基于联合学习的问答情感分类方法。该方法通过大量自然标注普通评论辅助问答情感分类任务,将问答情感分类作为主任务,将普通评论情感分类作为辅助任务。具体而言,首先通过主任务模型单独学习问答型评论的情感信息;其次,使用问答型评论和普通评论共同训练辅助任务模型,以获取问答型评论的辅助情感信息;最后通过联合学习同时学习和更新主任务模型及辅助任务模型的参数。实验结果表明,基于联合学习的问答情感分类方法能较好融合问答型评论和普通评论的情感信息,大幅提升问答情感分类任务的性能。  相似文献   

3.
针对当今社会人们因缺乏心理知识而导致心理疾病患病率急剧上升的问题,构建了一个小型的心理咨询知识图谱与问答系统(Question Answering system,QA)。该系统可以帮助咨询者及时获取心理知识,也可以识别出有自杀倾向的咨询者,防止危险发生。搜集了一些心理信息数据,通过构建字典并生成实体与关系构建了知识图谱;使用了HanLP(Han Language Processing)分词工具来生成关键词,通过CHI(Chi-square)特征选择来进行问题分类,提高问答效率;通过与其他模型对比,优选BiLSTM(Bi-directional Long Short-Term Memory)模型构建了自杀倾向文本分类器来检测危险的用户发言;通过计算相似度得分来进行问题模板匹配并生成答案。最后进行系统正确率测试,证明了该系统可以有效回答心理咨询相关的问题。  相似文献   

4.
属性分类是属性级情感分析中的一个重要任务。该任务旨在对文本包含的某些具体属性进行自动分类。已有的属性分类方法研究基本都是面向新闻、评论等文本类型。与已有研究不同的是,该文的研究主要面向问答文本的属性分类任务。针对问答文本的属性分类问题,该文提出了一种多维文本表示的方法。首先,该方法进行中文句子切分;其次,使用LSTM模型对每个子问题和答案学习一个隐层表示;再其次,通过融合多个隐层表示,形成多维文本表示;最后,使用卷积层处理多维文本表示,获得最终分类结果。实验结果表明该方法明显优于传统的属性分类方法。  相似文献   

5.
汉语语料的切分标注加工系统   总被引:3,自引:1,他引:3  
徐菁  张辉  陆汝占 《计算机工程》2003,29(9):66-68,165
介绍了一个对汉语语料进行切分标注粗加工的系统WegPos。该系统采用前缀码分词算法,用二元语法模型进行词性标注,并利用概率统计、规则、歧义数据库、部分句法分析等多种方法的结合排除分词和标注中产生的歧义。  相似文献   

6.
基于小规模标注语料的机器学习方法研究   总被引:3,自引:0,他引:3  
文中通过讨论机器学习和自然语言处理之间的关系,论述了语料库语言工程中机器学习的困境,概述分析了应用半监督学习的现状,研究有限样本下结合未标注样本的方法和统计学习理论框架的结合前景。  相似文献   

7.
问题理解是问答系统的首要的分析工作,分析的结果对后面的处理,以至找到问题的正确答案都有很大的影响。该文将对常规的问题理解方法进行改进,从而使系统能够较准确地回答用户的提问。实验证明新的方法对提高系统性能有显著作用,尤其针对性强、意思表述清晰的提问,回答准确率有很大提高。  相似文献   

8.
问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。为了提高中文问答系统的性能,文章在问答系统CQAS中采用了语义角色标注的思想,利用Proposition Bank中文语料库作为训练和测试语料,以句法成分作为标注的基本单元,采用最大熵模型作为分类器,把与谓词动词相关的全部句法成分进行语义角色标注。实验结果表明,语义角色标注技术可以有效地提高问答系统的性能。  相似文献   

9.
汉语语料的自动分类   总被引:16,自引:3,他引:16  
语料库语言学的发展要求语料库的规模越来越大。随着电子出版业的迅速发展, 获取大量机读文本建立大规模语料库已成为可能。但是收集来的粗语料是杂乱无章的, 在作加工整理前必须分类。若用手工分类则工作量很大。本文介绍了一种语料自动分类办法。它采用文中提出的语料相关系数的概念, 并利用不同类语料相关系数不同的特点进行分类, 取得了93%的大类分类正确率。  相似文献   

10.
问题理解是问答系统的首要的分析工作,分析的结果对后面的处理,以至找到问题的正确答案都有很大的影响。该文将对常规的问题理解方法进行改进,从而使系统能够较准确地回答用户的提问。实验证明新的方法对提高系统性能有显著作用,尤其针对性强、意思表述清晰的提问,回答准确率有很大提高。  相似文献   

11.
英汉小句对齐语料库服务于英语和汉语小句的语法结构对应关系研究和应用,对于语言理论和语言翻译(包括人的翻译和机器翻译)有重要意义。前人的语法理论和相关语料库的工作对于小句复合体和小句的界定缺乏充分研究,在理论上有缺陷,难以支持自然语言处理的应用。该文首先为英汉小句对齐语料库的建设做理论准备。从近年提出的汉语小句复合体的理论出发,该文界定了成分共享的概念,基于话头共享和引语共享来界定英语的小句和小句复合体,使小句和小句复合体具有功能的完整性和单一性。在此基础上,该文设计了英汉小句对齐的标注体系,包括英语NT小句标注和汉语译文生成及组合。语料库的标注表明,在小句复合体层面上英汉翻译涉及到的结构变换,其部件可以限制为英语小句和话头、话体,无须涉及话头和话体内部的结构。基于这些工作的英汉小句对齐语料库为语言本体研究和英汉语言对比、英汉机器翻译等应用提供了结构化的标注样本。  相似文献   

12.
《软件》2019,(9):84-86
本文设计了一种分层结构的聊天机器人系统,在互联网上搜集与顾客服务相关的对话数据,设计电商顾客服务领域的知识库,构建基于LSTM的Seq2Seq模型用于生成回答,使用朴素贝叶斯分类模型来对不同类型的问题选择合适的回答策略,并在必要时转向人工客服。  相似文献   

13.
基于领域知网的中文自动答疑系统的设计   总被引:2,自引:1,他引:1  
针对传统中文自动答疑系统的不足,借鉴《知网》的思路,并在此基础上提出了一种基于领域知网的中文自动答疑系统CQASTH。为验证系统答疑的准确性,实现了一个实验系统CMHQAES。实验表明,CQASTH实现了语义理解和语义计算,提高了答疑的准确率。  相似文献   

14.
分析了客户/服务器模式和Socket编程的基本原理,阐述了在Java环境下应用Socket技术实现网络聊天系统的基本思想和功能,并给出了具体的实现代码.  相似文献   

15.
制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,对兼类词语境进行向量分类,判定兼类词词性标注是否一致,得出每篇文章的词性标注的一致性情况,并测试了北京大学的150万语料。  相似文献   

16.
一个实现多种切分标注算法的系统   总被引:2,自引:0,他引:2  
方华  陆汝占  刘绍明 《计算机工程》2004,30(24):122-124,194
介绍了一个对汉语语料进行切分标注的系统——SEGPOS。该系统采用模块化设计,具有灵活的算法实现、替换机制,并能动态扩展各类数据资源,为开发切分、标注算法,进行多种算法的横向比较研究,提供了一个良好的平台。给出了在SEGPOS上实现的多种切分、标注算法的测试结果和分析。  相似文献   

17.
针对当前中小型企业办公人员对即时通讯软件要求较低等问题,提出了一种基于Java平台下的网络聊天系统的设计与实现方案,对系统进行了整体设计和详细设计,该系统主要通过Java Socket网络编程实现通信,具有速度快,高稳定性,占用系统资源少,用户界面友好等特点。最后该文还介绍了系统设计的关键技术,通过这些技术提高了网络聊天的效率。  相似文献   

18.
统计与规则并举的汉语词性自动标注算法   总被引:8,自引:0,他引:8  
张民  李生  赵铁军  张艳风 《软件学报》1998,9(2):134-138
本文提出并实现了一种基于定量统计分析优先的统计和规则并举的汉语词性自动标注算法.本算法引入置信区间的概念,优先采用高准确率的定量统计分析技术,然后利用规则标注剩余语料和校正部分统计标注错误.封闭和开放测试表明,在未考虑生词和汉语词错误切分的情况下,本算法的准确率为98.9%和98.1%.  相似文献   

19.
开发的网络聊天系统是基于开放的Java应用程序设计的,能动态、实时地完成信息的传递,且具有高效的交互性,能更有效地处理客户请求,易于维护和更新.系统采用客户机/服务器的架构模式,客户端通过Socket发送信息给服务器,从而实现多点对多点的聊天.系统界面采用Java中的Swing技术来实现.  相似文献   

20.
Android 是一种基于 Linux V2.6内核的自由及开放源代码的智能手机操作平台;Socket是一种网络编程接口。介绍了 Android 基于 Socket 的通信机制,建立了一个基于 Socket 的Android 聊天室系统。其中 Android 平台的手机作为客户端,PC 作为服务器端。该系统能够实现登录、注册、公聊、私聊、文件传送等功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号