首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
基于主题语言模型的句子检索算法   总被引:1,自引:0,他引:1  
提出了基于主题语言模型的汉语问答系统句子检索算法,该算法利用问答系统中特有的提问分类信息(即提问的答案语义信息)对句子初检结果进行主题聚类,通过Aspect Model将句子所属的主题信息引入到语言模型中,从而获得对句子语言模型更精确的描述 .对于初检结果的聚类,提出了"一个句子多个主题"和"一个句子一个主题"两种算法 .相对于PLSI算法的主题空间维度,提出的主题空间具有更加明确的物理意义;由于不需要迭代运算,运行速度更具优势 .对比实验的结果表明,与标准语言模型方法相比,基于主题语言模型的方法可以明显地提高汉语问答系统句子检索模块的性能 .  相似文献   

2.
基于网络的中文问答系统及信息抽取算法研究   总被引:24,自引:3,他引:21  
问答系统(Question Answering System)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著,对测试问题集的MRR值达到0.51。  相似文献   

3.
文章设计并实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间,提出了一种针对该系统的信息抽取算法,并采用一种基于语句相似度计算的答案抽取算法并且进行了改进。实验结果表明该系统对人名及时间类型的问题效果显著。对测试问题集的MRR值达到0.47。  相似文献   

4.
问答系统旨在用准确、简洁的答案回答用户用自然语言提出的问题。以旅游信息服务为应用背景,提出了基于领域知识的问答对自动提取方法。考察了常见旅游问题,建立了领域知识,在此基础上,设计了用户问题模式匹配算法和答案提取算法,对于不能匹配模式的问题,采用句子相似度计算得到相关的答案。实验结果表明,提出的方法是可行的,实现了旅游问题的自动问答。  相似文献   

5.
颜德彪 《信息与电脑》2023,(13):123-125
为提高医疗服务水平,设计基于知识图谱的医疗问答系统。首先,构建医疗问答系统,在业务层中搭建医疗数据知识图谱,并生成医疗问题知识模板;其次,采用基于相似度的问句实体抽取算法和意图识别算法,以获取用户的问题意图;最后,将意图传输至知识图谱,并查询相应答案返回给用户,从而实现智能医疗问答。  相似文献   

6.
罗宇翔  邹艳珍  金庸  谢冰 《计算机科学》2015,42(12):23-25, 35
开源项目通常会提供邮件列表来帮助用户更好地理解和使用开源项目。但由于邮件的数量巨大、邮件内容组织繁杂、问题不明确、答案定位困难等问题,用户在邮件查询过程中定位一个特定的软件问答信息要花费大量的时间和精力。为此,提出一种基于邮件列表的软件问答信息抽取方法。该方法通过对邮件的简单分类与标注,实现自动的问题句抽取和答案邮件选取,从而提升了用户进行邮件列表查询以及开源软件项目学习的效率。最后,通过实验验证了该方法的有效性。  相似文献   

7.
基于句法结构特征分析及分类技术的答案提取算法   总被引:1,自引:0,他引:1  
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.  相似文献   

8.
微软小冰引发了问答系统的新一轮研究热潮。作为一种新型的信息检索方式,问答系统能直接以自然语言与用户进行人性化的交互。而基于Web的问答系统能通过搜索引擎获取开放的互联网上的各种相关信息,并将以自然语言形式表述的准确答案返回给用户,因此此类系统同时具有搜索引擎和问答系统的优点。首先,对基于Web的问答系统的研究背景与发展历史进行了概述;然后,详细介绍了基于Web的问答系统的架构及其问题分析、信息检索、答案抽取这三大关键技术的研究进展;在此基础上,分析了基于Web的问答系统所面临的问题;最后,对基于Web的问答系统的未来发展趋势进行了展望。  相似文献   

9.
FAQ问答系统是一种在已有的"问题—答案"对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的系统。句子相似度计算是FAQ问答系统的关键技术,系统通过句子相似度算法计算用户问句与FAQ库中的问句的相似度,把相似度最大的问句答案返回给用户。因此,句子相似度算法的好坏直接决定了系统结果的准确度。文章给出了一个基于格语法的句子相似度计算方法,通过加入格语法的语义分析提高句子相似度算法的准确度。  相似文献   

10.
陈玉 《电脑开发与应用》2011,24(1):30-31,55
阐述的中文问答系统是以网络信息为支撑,结合传统问答系统的思想和网络信息资源的特点,采取切实有效的方法,来回答用户用自然语言形式提出的问题.系统的核心部分是依据关键词距离算法进行答案抽取,该算法是在总结大规模网络摘要及中文问句特点的基础上得出的,从最后实验结果看该系统效果显著,对测试问句集的MRR值达到了0.56.  相似文献   

11.
何建忠  吕振俊 《计算机工程》2008,34(17):56-58,6
针对传统数据挖掘算法的不足,提出基于两个矩阵的优化关联规则挖掘算法。该算法对事务数据库进行一次扫描,将其转换成两个用于存放逻辑数据的矩阵,并保留项目间的关联信息。对两个矩阵进行挖掘,基于矩阵MA得到频繁1-项集和频繁2-项集,基于矩阵MB得到最大频繁项集,其他频繁k-项集基于两个矩阵和已得频繁集获取。该算法极大减少了候选频繁集数量,挖掘过程采用逻辑运算。实验结果证明了其可行性和高效性。  相似文献   

12.
杜永萍  叶乃文 《计算机工程》2008,34(17):186-187
问答式信息检索是新一代搜索引擎,集成自然语言处理和信息检索科学的研究成果,提高信息检索效率。该文介绍问答式信息检索中的模式优化及其应用,并进行客观评价。模式在问答式信息检索中有两个重要应用——查询扩展和答案抽取。实验结果表明,在TREC标准测试集上,采用模式匹配策略实现答案抽取,能有效地提高问答式信息检索系统的准确率。  相似文献   

13.
模式学习在QA系统中的有效实现   总被引:6,自引:1,他引:6  
开放领域的问题回(question answering)是自然语言处理领域中具有挑战性的研究方向.提出了一种基于模式学习实现问题回答的方法,核心思想是利用机器学习方法得到的答案模式获取问题答案.该方法优势在于:①模式学习完全自动化实现;②解决了目前普遍存在的模式约束性弱及答案缺乏语义类型限制等缺陷.在TREC测试集上的实验结果表明,它不但解决了简单模式所覆盖的问题集,同时也解决了需要较强约束性模式进行答案抽取的问题集,而后者的问题数目在TREC测试问题集中占约80%.  相似文献   

14.
本文简略介绍了中文问答系统的基本结构和实现过程,着重介绍了问答系统中的列表类问题的分析,以及答案抽取时所采取的模式匹配和基于语义相似的抽取方法。  相似文献   

15.
本文简略介绍了中文问答系统的基本结构和实现过程,着重介绍了问答系统中的列表类问题的分析,以及答案抽取时所采取的模式匹配和基于语义相似的抽取方法。  相似文献   

16.
吴勇 《计算机时代》2011,(2):11-12,16
利用论坛的问题解答资源作为数据源建立了网络论坛问答检索系统,系统涉及到数据采集、数据处理、答案抽取、索引排序、问题映射等问题.重点研究了决定系统性能的答案抽取技术.在进行答案抽取时,使用Ranking SVM对回帖文档进行排序,得到问题对应的所有回帖的一个全序排列,进而抽取序列的前几项得到最佳答案.  相似文献   

17.
模糊超球神经网络在模式聚类中的应用   总被引:3,自引:0,他引:3  
提出和实现了用于模式聚类的无监督模糊超球神经网络.模式集是一个具有超球核 的用隶属函数表示的模糊集,模式集又可以合并成模式类.模糊超球神经网络学习算法能在 几次循环学习中形成模式集,无需对已知模式集重新训练就可融合新样例和精炼已存在的模 式集.模式聚类的数值仿真解释了模糊超球聚类神经网络的优越性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号