首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
面向跨语言信息检索任务提出了一个引入双语主题的跨语言伪相关反馈模型.将潜在狄利克雷分配模型扩展为能同时对双语文档建模的主题模型,其中每个主题既可以生成源语言词项,也可以生成目标语言词项;为查询式选择相关的双语主题,并利用其中的相关词项对查询翻译进行优化扩展,获得用于二次检索的新查询.实验结果表明,基于该反馈模型的跨语言检索效果优于其他基于单语主题模型和向量空间模型等反馈策略.  相似文献   

2.
在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该文提出了一种整合用户查询行为与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态调整索引库关键词权重,从而提高信息检索的查全率和查准率.  相似文献   

3.
是从源语言文档生成目标语言摘要的任务。最近,端到端跨语言摘要模型通过使用大规模、高质量数据集取得令人瞩目的结果,这些数据集通常是通过将单语摘要语料库翻译成跨语言摘要语料库而构建的。然而,由于低资源语言翻译模型性能有限,翻译噪声会严重降低模型性能。提出一种细粒度强化学习方法解决基于噪声数据的低资源跨语言摘要问题。引入源语言摘要作为黄金信号,减轻翻译后噪声目标摘要的影响。具体来说,通过计算源语言摘要和生成目标语言摘要之间的词相关性和词缺失度设计强化奖励,并将其与交叉熵损失相结合优化跨语言摘要模型。为验证所提出模型性能,构建汉语-越南语和越南语-汉语跨语言摘要数据集。实验结果表明,所提出模型在ROUGE分数和BERTScore方面优于其他基线。  相似文献   

4.
由于蒙古语文本数据的匮乏以及语言分析困难等原因,蒙古语信息化处理发展缓慢。针对该问题,利用语义网本体技术,以自然灾害为本体构建了一个面向蒙古语自然灾害信息的跨语言检索模型,实现了蒙英自然灾害信息间的跨语言检索。同时,本文提出的跨语言检索模型具有一定的通用性,可为类似应用研究提供参考。  相似文献   

5.
提出了一种基于信息检索技术的程序源代码与中文文档关联信息的自动提取方法.假设程序员在编写代码时使用了有意义的类、函数和变量名,利用信息检索方法得到对应的包含有这些意义的文档.通过提取文档中的词汇建立文档的语言概率模型,在此基础上采用由代码信息组成的检索项来检索文档集,由此得到代码和文档的相关性列表和关联矩阵.通过三个软件系统对此方法进行测试,结果表明,当提取项大于5时可获得95%以上的关联.  相似文献   

6.
为了减轻用户在检索信息过程中的负担,在信息检索中引入本体的概念.本体能够准确描述概念之间的内在关联,为人们提供全面而有效的信息.采用领域本体来表示和组织古建筑领域知识,建立一个集建筑构件、建筑文化和建筑结构为一体的本体模型.利用Java开发一个基于古建筑构件本体的检索系统,抽取本体中的同义词加入查询和检索中,通过实验结果表明不仅为用户提供了准确而全面的查询信息,而且提高了检索的准确率.  相似文献   

7.
搜索引擎给信息检索带来很大的帮助,但是信息的查准率和个性化却很难保证,针对这些问题,提出了一种基于元搜索引擎的个性化信息检索系统.采用Agent技术构建系统,利用用户知识库建立和更新用户模型,对检索结果的向量空间模型算法结合用户知识库进行了改进.实验表明:系统对于查准率有一定的提高,可以满足用户的个性化需求.  相似文献   

8.
大数据下监控网络混合入侵信息检索仿真   总被引:1,自引:0,他引:1  
针对传统的监控入侵信息检索方法存在检索精度低、召回率高、检索耗时长等问题,提出一种大数据下监控网络混合入侵信息检索方法.采用遗传算法对特征集进行优化选择,引入偏F检验对选择最优子集,组成优化特征集,并构建冗余信息消除模型,消除混合入侵信息中的冗余信息.以信息检索理论为依据,引用LDA模型对文档的话题进行建模,构建入侵信息检索模型,完成大数据下监控网络混合入侵信息检索.结果表明,所提方法的检索精度较高,能够有效提高入侵信息检索效率,降低检索耗时,且召回率平均值约为24%,优于其他方法,具有一定可行性.  相似文献   

9.
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型; 其次通过语音文档分割方法构建了语音文档索引库; 最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时, top -k评价方法的检索均值平均精度达到86.74%, 召回率达到95.25%, 该结果表明本文提出的方法是有效的,具有一定的实际应用价值.  相似文献   

10.
提出一种基于上下文多元信息实现文档相似度计算的方法,该方法首先抽取文档的特征词,对具有相同(或相近)意义特征词的文档,分别获得特征词在上下文中同现词的词性、语义信息、位置关系、平均同现概率等多元信息,以量化形式描述成一个相似函数;然后分别从两两文档的相似函数中得到文档的相似度评价值,作为衡量文档相似程度的重要依据.利用该评价方法,使用NTCIR-3中的跨语言信息检索数据集中的中文文档,对初始检索文档的顺序重新排列,实验结果表明,该方法分别将前10个最佳召回文档和前100个最佳召回文档的平均精确度提高了15.45%~18.49%和11.96%~15.35%在另一组有关相同网页信息的实验中,几组不同类别文档相似度F1-measure平均值均在95%以上.  相似文献   

11.
为了解决传统信息检索系统中存在的不足,以教务信息检索为例,提出了基于本体的语义信息检索系统的3层模型框架。在模型框架基础上,利用Protégé工具创建了教务知识本体,作为系统的数据源,利用Jena工具和Sparql语言实现了语义信息推理和检索,利用XML和XSL技术实现了用户界面显示,形成了一个完整的语义教务信息检索系统。  相似文献   

12.
As background knowledge of geographic information retrieval (GIR), the gazetteers have their limitations. In this paper we propose to develop and implement a common sense geographic knowledge base (CSGKB) instead of the gazetteers. We define that CSGKB is concerned with the representation of geographic knowledge in human brain and the simulation of geographic reasoning in daily life. Traditional geographic information system (GIS) is based on the model of map with its data based on geographic coordinates and its computation based on geometry. However, CSGKB, which is made up of geographic features and relationships and is based on qualitative spatio-temporal reasoning, can be viewed as the direct model of geographic world. This paper also discusses the characters of CSGKB and presents its structure which is composed of knowledge base, inference engine, geographic ontology and learner. The applications using CSGKB include geographic information retrieval (GIR), natural language processing (NLP), named entity recognition (NER), Semantic Web, etc. At present, our work focuses on the design of geographic ontology and the implementation of the CSGKB knowledge base. In this paper we describe the CSGKB ontology structure, top ontology, geographic location ontology, spatial relationship ontology, and domain ontologies. Finally, we introduce the current state of implementation of CSGKB and give an outlook on our future researches.  相似文献   

13.
In order to improve the utilization ratio of knowledge retrieval,a product-design knowledge retrieval approach based on ontology is proposed.A representation model of product-design knowledge is proposed according to its characteristics.Domain ontology of product-design is established and the semantic annotation technology is used to connect the design knowledge and ontology.A new semantic annotation format is developed and semantic information of the design knowledge is enriched by making use of ontology.On that basis a retrieval algorithm is designed for semantic retrieval.Finally,this approach is used in a knowledge management system for military-vehicle design and its effectiveness and feasibility are validated.Results show that the recall ratio and the precision ratio of knowledge retrieval are improved greatly and users’ requirements in semantic retrieval are satisfied.  相似文献   

14.
The information integration method of semantic web based on agent ontology (SWAO method) was put forward aiming at the problems in current network environment, which integrates, analyzes and processes enormous web information and extracts answers on the basis of semantics. With SWAO method as the clue, the following technologies were studied: the method of concept extraction based on semantic term mining, agent ontology construction method on account of multi-points and the answer extraction in view of semantic inference. Meanwhile, the structural model of the question answering system applying ontology was presented, which adopts OWL language to describe domain knowledge from where QA system infers and extracts answers by Jena inference engine. In the system testing, the precision rate reaches 86%, and the recalling rate is 93%. The experimental results prove that it is feasible to use the method to develop a question answering system, which is valuable for further study in more depth.  相似文献   

15.
一种基于本体的空间信息Web服务实现方法   总被引:1,自引:0,他引:1  
为了提高空间信息Web服务的互操作性,提出了一种利用本体技术实现空间信息Web服务发现与检索的解决办法.通过Web服务本体描述语言(OWL-S)实现对空间信息Web服务能力知识表达,在标准的开放地理信息系统协会(OGC)空间信息Web服务基础上,建立了一个基于本体目录服务的空间信息服务框架.并给出了基于这一框架服务请求的实现过程.结果表明,本体技术可以扩展空间信息Web服务的语义,能将服务匹配过程中得到的相似的Web服务复用于当前服务请求,提高知识推理的效率.  相似文献   

16.
针对传统基于关键字匹配的检索方法在地方志数据查询时的不足,给出了基于Solr和本体的地方志数据语义检索解决方案。建立了地方志本体库;提出了基于本体的综合语义相似度进行语义查询扩展的方法;将本体技术与全文检索技术相结合,建立了基于Solr和本体的语义检索模型架构。最后设计实验,对数据库SQL查询方法和文章提出的语义检索方法的查全率、查准率和查询时间进行对比。实验表明,文章提出的方法明显优于基于关键字匹配的数据库SQL查询方法,具有可行性和有效性。  相似文献   

17.
基于关键词的传统信息检索技术缺乏语义理解能力,无法满足用户的需要。简要地介绍实现语义检索涉及到的相关概念包括资源描述框架,语义网技术和本体。本文对语义检索所涉及的关键技术进行了深入的分析研究,提出了一种基于本体的语义检索的方法,以人力资源领域本体为例,设计并实现了基于Ontology的人力资源语义检索系统。  相似文献   

18.
针对当知识管理系统以互联网上存在的丰富海量知识作为知识源时,因同一知识的不同描述造成所需知识的查找困难问题,提出利用本体对知识进行描述,使同一知识的不同描述通过相似本体关联起来.为了降低本体的建立难度以及维护成本,研究并开发了一种基于本体的web知识管理系统(O-WKMS)原型. 给出了系统结构模型、过程模型,详细描述了基于自组织原理的本体协同建设技术,结合Lucene引擎,实现基于本体的语义搜索.初步应用表明,该系统通过本体的自组织的协同建设,可以有效地促进企业知识库的有序化,提高企业进行web知识的发现、管理和搜索的效率.  相似文献   

19.
随着高校办公信息的不断增多,传统信息检索系统由于缺乏知识的处理,检索结果很难令人满意;为提高信息检索的查准率和查全率,提出将本体技术应用到信息检索中,研究并构建高校办公信息领域本体,设计了一个基于本体的信息检索系统模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号