首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
问答系统是自然语言处理领域中的一项重要任务,常应用于医疗服务。传统的问答系统通过知识图谱的实体关系匹配返回相应的尾实体作为答案,然而,倘若实体或关系无法识别,又或者在知识图谱中并不存在相应的实体关系,问答将无法继续进行。为了解决这一问题,建立一种融合知识图谱和语义匹配模型的中文医疗问答混合系统。当所提问题无法在知识图谱中进行实体关系匹配时,该模型能继续从问答对数据集中找到最相似的问题,并返回相应结果作为答案。在语义匹配模型方面,结合中文医疗相似问题对,在Sentence-BERT模型上进行微调训练,并引入双曲空间中的距离度量函数对句子对进行相似度度量。结果表明:在整体性能方面,所提模型相较于BERT这类大语言模型精度能提升7.16%;在度量能力方面,双曲度量相较于通用欧氏空间度量,如余弦度量,最高能有2.28%的精度提升和1.58%的F1值提升。  相似文献   

2.
随着深度学习的兴起和不断发展,视觉问答领域的研究取得了显著进展,当前较多视觉问答模型通过引入注意力机制和相关迭代操作来提取图像区域与高频疑问词对的相关性,但在获取图像与问题的空间语义关联方面的有效性较低,从而影响答案的准确性.为此,提出一种基于MobileNetV3网络及注意力特征融合的视觉问答模型,首先,为优化图像特...  相似文献   

3.
答案抽取对提高问答的质量和性能有着重要的作用,但现有的答案抽取方法存在问句和文本信息交互的问题。结合上下文的答案抽取模型虽然可以从文本中抽取出给定问题的答案,但这种抽取方法并未考虑文本和问句的信息交互。而只有问句和文本数据时,要从文本中获取更加精准的问句答案,可以利用问句和文本之间的语义信息,预测问句与文本实体之间的关联。基于此,使用问句对齐层和多头注意力机制构建一个交互文本和问句之间的信息模型。实验结果表明,相较于BIDAF-INDEPENDENT模型,改进后模型的EM值和F1值分别提高了1.281%和1.296%。  相似文献   

4.
开放域问答技术研究进展   总被引:6,自引:0,他引:6       下载免费PDF全文
张志昌  张宇  刘挺  李生 《电子学报》2009,37(5):1058-1069
 问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足.最后,对问答技术未来的研究趋势进行了分析与展望.  相似文献   

5.
由于现有的机器阅读理解模型对于文本信息的理解能力欠佳,模型的问题回答准确度也有待提升。为了提升相关模型对于文本的阅读理解能力,提出了一种双打分机制。先依据文章信息的自注意力权重判断文章中每个词语的重要程度,进而可以排除掉一些不重要的信息,并给予重要信息以更高的权重。随后再从问题的角度选取答案,计算文章中单词与问题的相关度,通过Softmax函数即可返回每个单词作为答案开头与结尾的概率,选取概率最高的单词,输出二者之间的内容,即可得到模型所认为的问题答案。在此方法中,模型是在排除了一些信息的前提下选择答案,这将会有着更高的效率。实验部分将采用SQuAD问答数据集来进行对比实验,在与BiDAF模型与DrQA模型的对比实验中,EM指数高出同类最好模型0.82。实验结果表明,采用该方法的模型相较于其他模型有着更高的准确率,该方法对于模型回答准确率的提升是成功的。  相似文献   

6.
为了实现医疗信息化中的疾病与诊疗的智能问答系统,本文提出一种基于人机交互的用户自然语言问题理解方法.该方法在关键词库的基础上,采用正向最大匹配算法对用户咨询进行词法分析.进而对医疗领域的问题进行分类,系统根据问题类别进行数据检索;并利用模板匹配方法,完成答案的提取,以句子作为答案的基本单位.最后,在JSP和Java平台上实现了B/S模式的医疗领域智能问答系统,验证了该方法的有效性.  相似文献   

7.
随着人工智能技术的不断发展,越来越多的自然语言处理技术应用到医疗行业。如何从海量医疗数据中提炼信息,并根据用户的问题给出针对性较强的回答,是推进医疗智能化的关键问题。文章研究利用BiLstm+CRF模型处理医疗领域问答相关数据,基于图数据库Neo4j构建一个医疗知识图谱,并在此基础上构建一个问答系统,实现医疗知识的自动问答服务。实验结果表明,该系统可以为用户提出的问题查找匹配准确答案并返回给用户。  相似文献   

8.
知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的问句映射为结构化的语义表征,再将其改写为知识库查询获取答案.目前,面向知识库问答的语义解析方法主要面临三个挑战:首先是如何选择合适的语义表征形式以表达问句的语义,然后是如何解析问句的复杂语义并输出相应的语义表征,最后是如何应对特定领域中数据标注成本高昂、高质量数据匮乏的问题.本文从上述挑战出发,分析了知识库问答中常用的语义表征的特点与不足,然后梳理现有方法并总结分析其如何应对问句的复杂语义,接着介绍了当前方法在标注数据匮乏的低资源场景下的尝试,最后展望并讨论了面向知识库问答的语义解析的未来发展方向.  相似文献   

9.
针对传统视觉问答任务无法完全捕捉多模态特征之间复杂相关性的缺点,文中提出了基于多模态融合的视觉问答传输注意网络。在特征提取部分,分别利用GloVe词嵌入+LSTM提取问题特征,并使用ResNet-152网络提取图像特征。通过3层传输注意网络进行多模态融合来学习全局多模态嵌入信息,进而使用该嵌入重新校准输入特征。文中设计了一个多模态传输注意学习架构,通过对传输网络进行重叠计算,使组合特征聚焦在图像和问题的细粒度部分,提高了预测答案的准确率。在VQA v1.0数据集上的实验结果表明,该模型的总体准确率达到了69.92%,显著优于其他5种主流视觉问答模型的准确率,证明了该模型的有效性和鲁棒性。  相似文献   

10.
杨思春  戴新宇  陈家骏 《电子学报》2015,43(8):1627-1636
开放域问答是当前自然语言处理和信息检索领域的研究热点,作为开放域问答系统的重要组成部分,问题分类可以缩小答案的搜索空间并决定答案的选择策略.近年来,基于机器学习的问题分类技术受到广泛的关注,相关研究表明问题分类的准确性直接影响问答系统的整体性能.本文从分类体系与数据集、特征提取、分类器设计、性能评测等层面,总结了问题分类技术近年的主要研究成果.重点分析了各种基于监督学习的问题分类方法的特点和不足,讨论了核方法、半监督学习、主动学习、迁移学习等在问题分类中的应用,同时对问题分类技术未来研究动向进行了展望.  相似文献   

11.
随着问答社区网站的兴起,越来越多的用户生成数据积累了起来。这些用户生成数据不仅具有海量的、多样性的等特点,还有着极高的质量和重用价值。为了高效地管理和利用这些数据,近年来研究人员基于这些数据进行了大量的研究和实践,而社区问答中的问题检索就是一个被广泛研究的课题。主要研究了面向大规模社区问答数据的问题检索方法。收集来自Yahoo!Answers等社区网站的超过1.3亿问题和10亿答案的大规模数据,与之前的基于百万量级的数据的问答社区相关研究工作相比有着明显的不同和极高的实用价值。在此数据的基础上,通过查询自动分类方法来提高每次查询效率和效果。在问题检索过程中,提出了应用查询问句和问题的结构信息和语义信息,结合排序学习算法来融合多种不同类别的特征的方法,通过应用训练数据生成排序模型来提高问题检索的相关性和词语不匹配等问题。实验表明,本文应用RankingSVM方法来训练的排序模型在不同数据集上,其准确率等评价指标上都相比以往的方法有着显著的提高。  相似文献   

12.
It is shown that the normalized least mean square (NLMS) algorithm is a potentially faster converging algorithm compared to the LMS algorithm where the design of the adaptive filter is based on the usually quite limited knowledge of its input signal statistics. A very simple model for the input signal vectors that greatly simplifies analysis of the convergence behavior of the LMS and NLMS algorithms is proposed. Using this model, answers can be obtained to questions for which no answers are currently available using other (perhaps more realistic) models. Examples are given to illustrate that even quantitatively, the answers obtained can be good approximations. It is emphasized that the convergence of the NLMS algorithm can be speeded up significantly by employing a time-varying step size. The optimal step-size sequence can be specified a priori for the case of a white input signal with arbitrary distribution  相似文献   

13.
Imprecise information is represented by fuzzy disjunctive information, and an extended fuzzy relational model is used to accommodate such information. In the presence of imprecise information, answers to a query can be categorized into two kinds of answers: sure answers and possible answers. To find more likely answers to a given query, the authors develop a method to measure the matching strength of each tuple as an answer to the query. The quality of an answer is higher in the case where less extra information is required and the more sure information is provided  相似文献   

14.
随着互联网技术的迅猛发展,使用互联网服务的人越来越多。网络代理作为互联网中的一项重要应用其用户数量也与日俱增。通过代理浏览恶意内容,进行匿名攻击等恶意使用代理的现象日趋严重。为了防止被滥用,许多代理使用了内容审计分析技术。而内容审计带来的处理延迟和开销严重影响了服务质量。针对内容分析的性能瓶颈问题,提出基于用户信任的审计加速策略。通过访问时间,目标网站类型等多个维度对代理用户行为进行细腻度的刻画,并充分考虑历史行为的累计效应,建立了多层次的用户信任模型,在完成内容审计功能的同时,提高基于内容分析可信代理的服务性能。  相似文献   

15.
王巍  李锐光  周渊  杨武 《通信学报》2013,34(Z1):11-91
突发话题传播建模与预测的主要目的是对网络中可能产生不良影响的、紧急性突发事件的后续传播进行控制。目前微博网络中的话题传播与预测研究尚处于起步阶段。通过对病毒传染模型、消息传播模型以及话题传播模型的深入研究,提出一种基于微博粉丝关系、用户活跃度和影响力的话题传播模型,将微博用户集合划分为感染用户、易染用户和免疫用户,分析感染用户和易染用户的粉丝关系,预测下个时间窗口内被感染的用户规模。沿用话题传播模型研究中的“内外场强”概念,通过研究发现“内场强”和“外场强”有特定的比例关系,基于用户群的规模大小,分别提出基于用户和节点规模的话题传播预测算法。相关实验表明,基于用户的算法预测更为准确但是时间复杂度较高,基于节点规模的算法则更适合大规模数据集的处理。  相似文献   

16.
Many seemingly simple questions that individual users face in their daily lives may actually require substantial number of computing resources to identify the right answers. For example, a user may want to determine the right thermostat settings for different rooms of a house based on a tolerance range such that the energy consumption and costs can be maximally reduced while still offering comfortable temperatures in the house. Such answers can be determined through simulations. However, some simulation models as in this example are stochastic, which require the execution of a large number of simulation tasks and aggregation of results to ascertain if the outcomes lie within specified confidence intervals. Some other simulation models, such as the study of traffic conditions using simulations may need multiple instances to be executed for a number of different parameters. Cloud computing has opened up new avenues for individuals and organizations with limited resources to obtain answers to problems that hitherto required expensive and computationally-intensive resources. This paper presents SIMaaS, which is a cloud-based Simulation-as-a-Service to address these challenges. We demonstrate how lightweight solutions using Linux containers (e.g., Docker) are better suited to support such services instead of heavyweight hypervisor-based solutions, which are shown to incur substantial overhead in provisioning virtual machines on-demand. Empirical results validating our claims are presented in the context of two case studies.  相似文献   

17.
张仰森  郑佳  唐安杰 《电子学报》2017,45(11):2800-2809
微博用户权威度是评价微博信息可靠性的重要因素之一.本文针对微博用户权威度的定量计算提出了一种基于多特征融合的微博用户权威度定量评价模型.首先,提出了用户权威度的概念,将其定义为用户影响力和被信服度两部分组成;在暂不考虑用户领域影响因子的情况下,基于新浪微博数据,抽取出微博用户信息传播影响力、用户信息完整度、用户活跃度以及用户平台认证指数4项评价特征,以构建了用户权威度定量计算模型;然后,采用层次分析法对所构建模型的4项评价特征的权值进行确定,并分别给出了4项评价特征的提取算法.同时,在用户关注关系网络的基础上,提出了一种基于用户被关注价值的用户信息传播影响力模型UIRank,并通过实验验证了其比PageRank算法更加有效.实验结果表明,本文提出的微博用户权威度定量计算模型比较合理,为用户权威度的定量评价提供了一种可行的解决方案.  相似文献   

18.
根据认知用户占用信道时长的统计分布和认知用户带宽需求的统计分布,利用随机分布函数和均匀分布的关系,建立了认知用户模拟模型。在MATLAB下,根据某地区通信基站的基本要求,结合认知用户模拟模型,建立了基于图论模型的认知用户仿真模型,可以计算空闲频谱矩阵、分配矩阵、干扰矩阵等图论模型要素。通过MATLAB仿真实验,验证了此模型与实际情况的吻合性。  相似文献   

19.
This paper presents a hybrid model solution for user motion recognition. The use of a single classifier in motion recognition models does not guarantee a high recognition rate. To enhance the motion recognition rate, a hybrid model consisting of decision trees and artificial neural networks is proposed. We define six user motions commonly performed in an indoor environment. To demonstrate the performance of the proposed model, we conduct a real field test with ten subjects (five males and five females). Experimental results show that the proposed model provides a more accurate recognition rate compared to that of other single classifiers.  相似文献   

20.
目前主流的点击预测模型采用线性模型和深度神经网络相结合的方法学习用户与物品之间特征交互,忽略了用户的历史行为本质上是一个动态序列的事实,从而导致无法有效捕获用户行为序列中蕴含的时间信息。为此,该文提出了基于用户行为序列的短视频用户多行为点击预测模型(USCP)。该模型将用户的历史行为按交互时间的顺序排序,生成用户历史行为序列。在DeepFM模型的基础上引入词嵌入模型Word2Vec,根据用户历史行为序列自适应学习到该用户的动态兴趣,有效捕获到用户兴趣的变化。在某短视频平台上公开的脱敏数据集上进行了对比实验,评价指标采用GAUC(Group AUC),结果表明该模型性能优于其他几个模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号