共查询到17条相似文献,搜索用时 187 毫秒
1.
问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务。提出了一种基于答案辅助的半监督问题分类方法。首先,将答案特征结合问题特征一起实现样本表示;然后,利用标签传播方法对已标注问题训练分类器,自动标注未标注问题的类别;最后,将初始标注的问题和自动标注的问题合并作为训练样本,利用最大熵模型对问题的测试文本进行分类。实验结果表明,本文提出的基于答案辅助的半监督分类方法能够充分利用未标注样本提升性能,明显优于其他的基准方法。 相似文献
2.
基于潜在语义分析的汉语问答系统答案提取 总被引:24,自引:0,他引:24
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词一句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果. 相似文献
3.
答案抽取是开放领域问答系统中的关健部分,主要由检索结果句子的重排和最终候选实体的抽取构成.通过把依存分析到引入到这两个步骤中,并结合改进的关键词密度算法,增强了对句法和语义知识的利用和系统的鲁棒性,在实验中答案抽取的效果明显提高. 相似文献
4.
5.
6.
意图识别与槽填充是语义提取的常用方法,其存在如下两个问题:依赖训练数据,需要标注大量的数据用于训练模型;可迁移性差,训练得到的模型难以复用。针对上述问题,该文对于不同的语义提取场景,提出了四种不同的语义模型。同时,该文研究了汉语语法的特点,基于依存句法,提出了不同的语义提取算法,解决了模型难以复用的问题。该方法对数据集的要求较低,节省了成本。最后,设计了语义提取实验,验证了在样本规模小且分布不均匀的数据集下,语义提取算法相比于部分中文文本分类算法有更高的准确率。该文提出的模型和算法具有一般性,对于文本分类、人机对话等不同语义提取场景具有较强的指导意义。 相似文献
7.
8.
介绍依存句法分析的理论和方法,句法分析是自然语言处理中的关键技术之一.比较自顶向下算法、自底向上算法和最大生成树算法,从而得出最大生成树算法是效果最好的.利用句法分析可以提高问题分类的正确率,从而提高整个系统的正确性. 相似文献
9.
10.
中国每年高考的考生教百万之巨,很多考生和家长对高考有这样或那样的问题,信息量需求非常大。开发基于招生咨询领域的自动问答系统是非常具有现实意义的。该文设计了一种基于招生咨询领域的自动系统,把蕴涵丰富招生咨询方面材料的文档库与常问问题答案库(FAQ)相结合,采用信息检索和答案抽取技术相结合,实现了从文档中自动得到答案的策略。 相似文献
11.
林晓庆 《数字社区&智能家居》2007,2(7):242-243
本文简略介绍了中文问答系统的基本结构和实现过程,着重介绍了问答系统中的列表类问题的分析,以及答案抽取时所采取的模式匹配和基于语义相似的抽取方法。 相似文献
12.
林晓庆 《数字社区&智能家居》2007,(4):242-243
本文简略介绍了中文问答系统的基本结构和实现过程,着重介绍了问答系统中的列表类问题的分析,以及答案抽取时所采取的模式匹配和基于语义相似的抽取方法。 相似文献
13.
该文描述了一种基于事例,通过人工总结规则建立模型来分析问答系统中问句,应用自然语言处理的相关技术,分词和专有名词识别对问句进行预处理,然后依据从3800多个问句中总结归纳出来的问句信息成分,进行问句的浅层分析。以及短语结构分析,获取问句的各个信息成分以及他们之间的依存关系。这些模型采用浅层语法分析和部分语义分析相结合来断定一个问句所包含的信息。同时在英文问答系统的基础上,提出了问句类型学和限制成分的语义类型学,深化了问句的表达形式,以能更好的解析问句。 相似文献
14.
15.
开放域答案选择模型通过对同一问题的不同候选答案打分,寻找与问题最匹配的答案,是问答(QA)系统的重要组成部分。现有开放域QA系统中的答案选择模型较少关注词级与句子级的融合,导致在匹配关系上缺乏上下文的语义联系,或损失个别单词在语法语义上的细节信息。基于相邻相似原理,提出一种融合双匹配焦点的答案选择模型。根据问答任务多语句关联的特点,设计一种可以将词语的问答承接关系和问答语义关系嵌入进词向量的词嵌入方式,并利用该词向量直接计算词对的余弦相似度,得到词级匹配焦点。通过引入注意力机制的Encoder-Decoder模型提取句子级词对匹配焦点,以问题为基准对齐两个焦点分布矩阵,并使用焦点间的相对距离融合词级与句子级匹配矩阵,获得问题与答案的相关性得分。在Wiki-QA、TREC-QA两个公开问答数据集上的实验结果表明,该模型与多跳注意力模型、层级排序模型相比,平均准确率均值分别提高0.080 1和0.057 1,平均倒数排名分别提高0.017 6和0.006 6。 相似文献
16.
17.
中国每年高考的考生数百万之巨,很多考生和家长对高考有这样或那样的问题,信息量需求非常大。开发基于招生咨询领域的自动问答系统是非常具有现实意义的。该文设计了一种基于招生咨询领域的自动系统,把蕴涵丰富招生咨询方面材料的文档库与常问问题答案库(FAQ)相结合,采用信息检索和答案抽取技术相结合,实现了从文档中自动得到答案的策略。 相似文献