首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
该文描述了一种基于事例,通过人工总结规则建立模型来分析问答系统中问句,应用自然语言处理的相关技术,分词和专有名词识别对问句进行预处理,然后依据从3800多个问句中总结归纳出来的问句信息成分,进行问句的浅层分析。以及短语结构分析,获取问句的各个信息成分以及他们之间的依存关系。这些模型采用浅层语法分析和部分语义分析相结合来断定一个问句所包含的信息。同时在英文问答系统的基础上,提出了问句类型学和限制成分的语义类型学,深化了问句的表达形式,以能更好的解析问句。  相似文献   

2.
为提高问答系统对问句理解的准确率,以概念层次网络理论结合传统计算语言学为思路,提出了适用于限定领域中问句分析模型,根据限定领域的知识特点,设计了新的问句分类方法。在此问句分类方法的基础上,构建了基于支持向量机理论的问句分类器。在以实际教学过程中所收集的真实问句为问题集和训练集的测试中,取得了较好的实践效果。  相似文献   

3.
为提高问答系统对问句理解的准确率,以概念层次网络理论结合传统计算语言学为思路,提出了适用于限定领域中问句分析模型,根据限定领域的知识特点,设计了新的问句分类方法。在此问句分类方法的基础上,构建了基于支持向量机理论的问句分类器。在以实际教学过程中所收集的真实问句为问题集和训练集的测试中,取得了较好的实践效果。  相似文献   

4.
中文问答系统中的问句理解   总被引:4,自引:0,他引:4  
卢志坚  张冬茉 《计算机工程》2004,30(18):64-65,153
描述了一种通过人工总结规则建立模型来理解问答系统中问句的方法。该模型采用浅层语法分析和部分语义分析相结合的方法来断定一个问句所包含的信息。  相似文献   

5.
面向问答社区的问答系统CQA(Community Question Answer)是近年来研究的热点,针对系统中问句分类的复杂性,提出一个粗粒度的分类体系及多标记多分类的问句分类算法——MLMC。基于SVM分类模型实现一个完整的分类系统,总体分类精度达到73.6%。  相似文献   

6.
受限领域问答系统的中文问句分析研究   总被引:1,自引:0,他引:1       下载免费PDF全文
对用户所提问句的理解是受限领域问答系统实现的关键,该文提出一种基于本体和问句句型模板规则的中文问句分析方法,研究如何使用问句语义表征来表示问句分析的结果,将该方法应用于某受限领域问答系统中。实验结果表明,使用该方法进行中文问句分析,准确率达90%以上,可以在实际的问答系统中使用该方法。  相似文献   

7.
基于最大熵模型的汉语问句语义组块分析   总被引:1,自引:0,他引:1  
问句分析是问答系统的关键,为降低问句完整语法分析的复杂度,该文应用浅层句法分析理论,采用问句语义组块方式来分析问句。以“知网”知识库为基础,提取和定义了表达汉语问句的6种语义块,定义了语义组块最大熵模型的特征表示,通过最大熵原理实现了语义组块特征抽取和特征选取学习算法,并以模型为基础实现了真实问句的语义块的标注,从而为在语义层面上理解汉语问句奠定了基础。实验结果说明最大熵模型应用于汉语问句语义组块分析具有较好的效果。  相似文献   

8.
提出一个深层次的问句语义分析算法,实现问句从文字空间到语义空间的映射。在问句语义分析算法的基础上,提出面向海量问答数据的检索模型,该模型采用搜索引擎的检索技术,利用问句语义分析的结果,将问句相似度计算结合到信息检索过程中,既保证了检索的效率又保证了检索的精度。  相似文献   

9.
基于问句类型的问句相似度计算   总被引:1,自引:0,他引:1  
目前,问句相似度的计算主要借鉴普通陈述句的相似度计算方法。由于普通陈述句的相似性更多反映的是语句间语义上的匹配符合程度,而衡量问句间的相似性则须同时考虑问句及其答案句之间的相似程度,为此,设计了一种新的问句相似度计算方法。该方法不仅利用问句之间的语义和语法特征考察问句之间的匹配程度,还利用问句的问题类型等信息来间接刻画答案句之间的特征形象,从而以获取问句的深层语义信息,以提高问句相似度计算的准确性。实验验证了该方法的有效性。  相似文献   

10.
根据旅游领域知识的特点,设计了面向旅游问句的分类体系。利用信息增益、互信息、交叉熵和X^2统计四种特征选择方法及支持向量机分类器,对网上常见的旅游真实问句分类进行了实验研究,实验结果表明:在现有问句分类体系下,信息增益的特征选择方法在特征空间维数为550维时,分类旅游问句的结果是最佳的。  相似文献   

11.
12.
针对传统通用网络爬虫的自身固有的缺陷,结合本体的相关理论,提出了一种基于语义本体的网络爬虫的相关模型。该模型以本体构建领域知识概念集,结合知网,从语义的角度,利用扩展的元数据,在词的语义层次,对抓取的页面链接进行语义相关性计算,预测与主题相关的URL,提高采集的网络资源信息与设定主题的相关度。实验结果表明,该模型同其它通用网络爬虫模型相比具有较高的信息抓取准确率。  相似文献   

13.
传统的形式化方法局限于严格的证明、对程序员要求较高的教育背景,使其举步维艰.于是作为形式化方法与面向对象的联姻的SOFL(Structured Object-Oriented Fomal Language)便应运而生.在给出语义分析的整体算法后,逐步分析各个阶段遇到的关键问题并给出解决方法,同时在参考其他语言的基础上,定义了SOFL中一些语义规则.  相似文献   

14.
基于语义web的agent系统模型   总被引:1,自引:0,他引:1  
随着互联网的迅速发展,网络信息的处理变得越来越复杂,语义web技术的出现正是为了解决这样的问题。在语义web上信息表示是面向机器可处理的,因此使得机器更容易自动处理网络上的资源,这大大方便了对网络资源的利用和收集。本文在此基础上提出一个基于语义web的agent系统模型,该系统主要包括information server、ontology base、client application三个模块,并结合了本体收集agent、搜索agent和本体agent。其中知识的表示由ontology实现,并可利用其实现一定的推理。  相似文献   

15.
一个基于语义分析的倾向性文档过滤系统   总被引:3,自引:0,他引:3  
目前的过滤系统大都是基于关键词的,这类系统适用于主题性过滤,而对倾向性过滤效果不好。本文提出一种适用于倾向性文档过滤的系统,通过语义分析,有效地识别和过滤倾向性文本信息。  相似文献   

16.
提出一个分布式的、基于语义服务的开放式信息检索模型(D-IRSW).该模型采用统一接口规范的不同的语义检索服务作用于不同的本体库,实现针对不同本体库的个性化检索;然后由语义检索服务引擎(SRSE)对不同语义检索服务返回的结果进行去重和排序.  相似文献   

17.
以电子商务领域本体为基础,旨在提出一种改进的基于概念语义相似度计算模型,该模型结合基于距离和基于内容两个方面,能够更为全面精确地量化本体中概念结点之间的语义相似度。据此,进行查询关键词集概念扩展和查询与结果文档的相似度计算,最终形成检索算法。实验对比于Lucene检索算法,通过选取热点概念关键词从准确率、召回率、响应速度3个指标来评估检索算法的性能。实验证明,提出的检索算法与基于Lucene的信息检索方法相比,检索性能有较大提高。  相似文献   

18.
基于关系/网状的语义超图多媒体描述模型   总被引:1,自引:0,他引:1  
本文提出了基于关系/网状的语义超图功述模型及各操作,引和面向对象的方法,统一描述对象和元组,提出了对象间的语义联系,基于联系的各种操作和施加工对象的方法机制。在语义超图层次,描述和操作了不同语义类的对象;在语义子图层次,描述了每一语义类的对象间的多对多关系及其操作,因此,该模型可用于描述和处理工程领域中的不同语义类多对多关系的复杂多媒体对象。  相似文献   

19.
基于潜在语义索引的文本分析方法   总被引:1,自引:0,他引:1  
本文分析是文本处理领域中的重要内容,它可以有效地改进文本检索、文本过滤以及文本摘要的精度.本文简要描述了文本的物理结构和逻辑结构以及文本分析的背景,将潜在语义索引引入文本分析中,提出了基于潜在语义索引的层次分析方法.该方法保证了层次划分的有序性和聚合性,可操作性强,便于解释,并给出了在文本检索、文本过滤和文本摘要中的应用.  相似文献   

20.
随着语义网的不断发展,网页语义的研究也在不断的进步。但现阶段的网络结构中,非语义化网页仍旧占据了信息系统最主要的部分。信息系统在整合的过程中,也需要了解网页的语义结构以完成信息的获取和分析。提出一种基于视觉特征筛选的网页语义结构分析方法。该方法可以在忽略网页语义的情况下,通过网页结构的视觉特性和内容特性分析网页中不同结构的语义关系,使用聚类分析方法来推定网页中半结构化信息的语义结构,并通过该方法对一组随机网页进行了分析,结果证明该方法具有比较好的分析能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号