首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
智能问答系统中问句相似度计算方法   总被引:2,自引:0,他引:2  
以《现代操作系统》为例,在智能问答系统中,综合考虑问句的词和语义等多方面特征,并对编辑距离法进行改进,设计了一种新的组合式问句相似度计算方法。实验结果表明,该算法取得了良好的效果,可以有效地提高问答系统的性能。  相似文献   

2.
问答系统现已成为自然语言处理领域和信息检索领域的一个重要分支,问句表征是问答系统的重要组成部分。针对问句分析的不足,采用改进的贝叶斯和疑问词相结合的方法,对问句进行分类,提取问句的类型;在初次查询的基础上,根据问句的类别进行关键词扩展,同时,加入新词识别的功能,即提出一种问句的表征方法,对问句进行充分、全面地理解;基于以上算法,在J2EE环境下开发出一个问句表征的web智能问答系统。实验结果表明,文中的问句表征方法能有效改善系统的性能。  相似文献   

3.
为研究面向大规模网络数据的社会化问答系统(Social Question and Answer System,SocialQA).分别描述了问答系统的各个组成技术:1)问句预处理:问句分析和问句扩展.2)问句匹配.本文在1500万个网络问答数据集上,进行了问句匹配的实验.实验表明:在封闭测试中,问句匹配的准确率,达到了90%以上,在开放测试中,问句匹配的准确率达到了70%以上,很好地满足了系统的精度和实时性的要求.  相似文献   

4.
利用加权特征模型改进问句分类   总被引:1,自引:0,他引:1  
为了减少目前大多数问句分类算法由于采用了布尔特征模型所导致的特征信息损失,提出了一个基于网络和聚类技术的加权特征模型来表达问句的特征空间.不同于以往采用的布尔特征模型将特征赋值为0或1以表示相应特征出现与否,新的加权特征模型将特征加权为一个位于区间0~10的一个实数,以区分不同的特征对于问句分类的贡献:权值越大,相应特征对于区分问句的类型做出的贡献越大.试验结果表明,该加权特征模型在问句分类领域优于之前被广泛使用的布尔特征模型.  相似文献   

5.
目前,自然语言处理系统由于缺乏语义信息及知识理解和推理能力,因此存在很多缺陷,在自动问答领域中很难分清用户表达的真正意图,并给出用户满意的答案.本文就此给出基于句法语义的问句分析方法,采用本体构建技术构建答案库,在此基础上进行领域知识语义推理,实现智能问答.本研究以黄山旅游为限定领域建立问答系统,试验结果表明多策略的方法是有效的.  相似文献   

6.
文本分类或文本匹配是解决基于常见问题和解答(FAQ)问答的2个途径.单独使用分类方法不能有效利用标准问题本身的信息,而单独使用匹配方法时,负样本的选择很困难,为此,提出一类将文本分类和文本匹配方法相结合的模型,不仅能选择真正需要区分的负例,并且能够有效利用标准问题的信息.实验结果表明,提出的模型在多个FAQ问答数据上能达到最好性能.  相似文献   

7.
自动问答系统是一个新兴的研究热点,它以自然语言的方式提出问题,采用自然语言处理技术,自动返给用户相关答案。本文概述了自动问答系统的常用技术和发展现状,介绍了主要的国际评测体系,并指出了将来的研究方向。  相似文献   

8.
中文问答系统中问题理解的研究与实现   总被引:1,自引:0,他引:1  
围绕中文问答系统中的问题理解技术,本文研究了如何进行词法分析、问题分类、关键词提取及扩展、句型分析和浅层语义分析,主要提出了基于启发的疑问词和疑问焦点相结合的问题分类方法、问句统一型的句型分析方法和基于语义角色标注的语义分析方法.在此基础上,在Visual C 6.0环境下开发了一个基于简单的事实类问题的中文问答系统原型.实验结果表明:本文提出的方法对改善中文问答系统的性能是有效的.  相似文献   

9.
文本自动分类是组织和管理文本信息的有力手段,可以在较大程度上解决信息杂乱无章的问题,使用户更容易更准确地定位所需的信息.目前,文本自动分类是信息检索领域中最前沿的研究热点之一,国内外均有大量学者从事这方面的研究.研究组对文本自动分类进行了深入细致的研究,针对文本自动分类目前存在的问题,提出了一些新的模型,大规模数据集上的实验表明该模型性能优异,表现优于很多方法.  相似文献   

10.
智能问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术.本文主要研究智能问答系统的关键技术.首先,详细地介绍了自动问答系统的概念原理与主要组成部分.其次,对该系统的中文分词模块及其相关技术进行了比较深入的研究,选择最大匹配、逆向最大匹配和设立自然切分点相结合的算法;在歧义字段处理方面,提出了基于句子整体考虑的计算句子词频和的方法,能够在处理特定歧义问题方面有很好的改进和提高.再次,对特定领域的问题进行分类,便于系统根据问题类别进行答案匹配.最后.利用赋权值方法,完成答案的提取,以句子作为答案匹配的基本单位.基于上述理论与算法,实现了一个地理领域的智能问答系统.  相似文献   

11.
针对支持向量机分类中数据量维数大、处理速度慢等缺点,该文提出了一种新的中文问题分类方法CRV,它利用粗糙集理论的属性约简方式预处理样本数据,在消除冗余的特征向量、降低样本数据空间维数的同时,有效地提高了支持向量机的收敛速度和分类精度。应用该方法于计算机网络课程的自动问答系统中,有效地提高了问题分类的准确率,验证了该方法的可行性。  相似文献   

12.
在线问答社区中大量问题等待回答时间过长、高质量回答数极少,对社区用户在具体问题上的专业程度进行度量具有现实需求。现有的基于链接分析和基于文本分析等方法多集中在社区和话题粒度的专业性度量,并未深入到问题粒度。针对上述问题,定义了问答社区中基于问题粒度的用户专业性概念,在此基础上提出了基于问题粒度的用户专业性预测方法,包括用户专业性度量方法和用户专业性预测模型。该预测方法先利用问答社区中社区用户对回答质量的评价机制,在问题粒度上为用户建立专业性度量;再基于矩阵分解,融合用户偏差、问题偏差以及用户已回答问题集的隐含反馈等信息,构建用户在问题粒度上的专业性预测模型,进而预测用户在待回答问题上的专业程度。利用知乎问答社区互联网话题下的问答数据集,设计了与前述两种主流方法的对比实验。实验结果表明,提出的用户专业性度量方法可以有效地度量用户在具体问题上的专业程度,基于此方法构建的用户专业性预测模型具有更高的预测精度。  相似文献   

13.
微机题库质量的优劣取决于良好的系统结构,研制便捷的题库开发工具,有助于非计算机教学人员编制高质量的本学科题库,实现考教分离。从工科院校专业课题库组建的特点出发,提出一种通用题库开发工具的模型设计方法。  相似文献   

14.
基于特征筛选的云分类器   总被引:3,自引:0,他引:3  
高维且不独立的样本特征集使分类的准确性降低,笔者提出一种根据样本集特征权值进行特征选择的方法。根据特征间的相似性度量函数计算特征的权重,并根据权重去除重要性差的特征,用于解决高维样本集的特征降维问题,特征选择结果与主成份分析结果一致。建立基于保留特征加权的云分类模型,应用于iris数据集和复杂矿石图像的分类,效果良好。  相似文献   

15.
A novel convolutional neural network based on spatial pyramid for image classification is proposed. The network exploits image features with spatial pyramid representation. First, it extracts global features from an original image, and then different layers of grids are utilized to extract feature maps from different convolutional layers. Inspired by the spatial pyramid, the new network contains two parts, one of which is just like a standard convolutional neural network, composing of alternating convolutions and subsampling layers. But those convolution layers would be averagely pooled by the grid way to obtain feature maps, and then concatenated into a feature vector individually. Finally, those vectors are sequentially concatenated into a total feature vector as the last feature to the fully connection layer. This generated feature vector derives benefits from the classic and previous convolution layer, while the size of the grid adjusting the weight of the feature maps improves the recognition efficiency of the network. Experimental results demonstrate that this model improves the accuracy and applicability compared with the traditional model.  相似文献   

16.
对硅藻细胞分类提出了一种基于内容的分类方法。该方法首先获取带外接圆的目标;然后,对其应用纹理主特征直方图,纹理变化度,纹理角特征3种方法提取出目标的特征向量;最后使用欧氏距离进行相似性度量。实验结果表明,该方法具有较好的分类准确率及召回率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号