首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在排序学习方法中,通过直接优化信息检索评价指标来学习排序模型的方法,取得了很好的排序效果,但是其损失函数在利用所有排序位置信息以及融合多样性排序因素方面还有待提高。为此,提出基于强化学习的多样性文档排序算法。首先,将强化学习思想应用于文档排序问题,通过将排序行为建模为马尔可夫决策过程,在每一次迭代过程中利用所有排序位置的信息,不断为每个排序位置选择最优的文档。其次,在排序过程中结合多样性策略,依据相似度阈值,裁剪高度相似的文档,从而保证排序结果的多样性。最后,在公共数据集上的实验结果表明,提出的算法在保证排序准确性的同时,增强了排序结果的多样性。  相似文献   

2.
文档排序一直是信息检索(IR)领域的关键任务之一。受益于马尔科夫决策过程强大的建模能力,以及强化学习方法强大的求解能力,近年来基于强化学习的排序模型被提出并取得了良好效果。然而,由于候选文档中会包含大量的不相关文档,导致基于“试错”的强化学习方法存在效率低下的问题。为解决上述问题,该文提出了一种基于模仿学习的排序学习算法IR-DAGGER,其基于文档标注信息构建专家策略,在保证文档排序精度的同时提高了算法的学习效率。为了测试IR-DAGGER的性能,该文基于面向相关性排序任务的OHSUMED数据集和面向多样化排序的TREC数据集进行了实验,实验结果表明IR-DAGGER在上述两个数据集上均提升了文档排序的精度和效率。  相似文献   

3.
针对基于图的多文档摘要,该文提出了一种在图排序中结合维基百科实体信息增强摘要质量的方法。首先抽取文档集合中高频实体的维基词条内容作为该文档集合的背景知识,然后采用PageRank算法对文档集合中的句子进行排序,之后采用改进的DivRank算法对文档集合和背景知识中的句子一起排序,最后根据两次排序结果的线性组合确定文档句子的最终排序以进行摘要句的选取。在DUC2005数据集上的评测结果表明该方法可以有效利用维基百科知识增强摘要的质量。  相似文献   

4.
在信息检索领域的排序任务中, 神经网络排序模型已经得到广泛使用. 神经网络排序模型对于数据的质量要求极高, 但是, 信息检索数据集通常含有较多噪音, 不能精确得到与查询不相关的文档. 为了训练一个高性能的神经网络排序模型, 获得高质量的负样本, 则至关重要. 借鉴现有方法doc2query的思想, 本文提出了深度、端到端的模型AQGM, 通过学习不匹配查询文档对, 生成与文档不相关、原始查询相似的对抗查询, 增加了查询的多样性,增强了负样本的质量. 本文利用真实样本和AQGM模型生成的样本, 训练基于BERT的深度排序模型, 实验表明,与基线模型BERT-base对比, 本文的方法在MSMARCO和TrecQA数据集上, MRR指标分别提升了0.3%和3.2%.  相似文献   

5.
胡小生  钟勇 《计算机应用》2012,32(12):3331-3334
当前排序学习算法在学习时将样本集中的所有查询及其相关文档等同对待,忽略了查询之间以及其相关文档之间的差异性,影响了排序模型的性能。对查询之间的差异进行分析,同时考虑文档排序位置造成的资料被检视概率不同的差异特性,提出了一种两层加权融合的排序方法。该方法为每一个查询及其相关文档建立一个子排序模型,在此过程中,对文档赋予非对称权重,然后通过建立新的损失函数作为优化目标,利用损失函数调节不同查询产生损失之间的权重,最终实现多查询相关排序模型的加权融合。在标准数据集LETOR OHSUMED上的实验结果表明,所提方法在排序性能上有较大提升。  相似文献   

6.
排序学习,即用有标记的训练集通过机器学习的方法学习一个排序函数,并对测试集的数据进行排序的技术.当前的文档排序学习算法主要是基于全监督排序学习的框架,它需要大量已标记的文档,而通过人工给文档赋予标记(完美、优秀、好、一般、差)是非常费力费时的.因此这里提出一种基于排列融合的归纳(inductive)式半监督排序算法.首...  相似文献   

7.
在许多信息检索任务中,为了进一步提高检索性能,通常需要对检索到的文档进行重新排序,目前的排序学习方法主要集中在损失函数的构造上,而没有考虑特征之间的关系。该文将多通道深度卷积神经网络作用于文档列表排序学习方法,即ListCNN,实现了信息检索的精确重排序。由于从文档中提取的多个特征中有一些特征具有局部相关性和冗余性,因此,文中使用卷积神经网络来重新提取特征,以提高列表方法的性能。ListCNN架构考虑了原始文档特征的局部相关性,能够有效地重新提取代表性特征。在公共数据集LETOR 4.0上对ListCNN进行实验验证,结果表明其性能优于已有文档列表方法。  相似文献   

8.
闫蓉  高光来 《计算机应用》2016,36(8):2099-2102
针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中选择排名靠前的文档作为伪相关文档集;然后,以用户查询意图与伪相关文档集中各文档的相关度最大化、并且各文档之间相似性最小化作为排序原则,将伪相关文档集中各文档进行重排序;最后,将排序后排名靠前的文档作为扩展源进行二次反馈。实验结果表明,与两种传统伪反馈方法相比,该排序模型能获得与用户查询意图相关的反馈文档,可有效地提高检索效果。  相似文献   

9.
基于图的特征词权重算法及其在文档排序中的应用   总被引:1,自引:0,他引:1  
信息检索的核心工作包括文档的分类和排序等操作,如何对文档中的特征词权重进行有效度量是其中的一项关键技术。利用词的共现等关系为每个文档建立文本图,基于邻接词间重要性相互影响的思路,结合文档中特征词的词频特性,迭代计算每个词的权重,进一步结合文本图的密度等全局特性,对信息检索的结果进行排序。实验证实,算法在标准数据集上具有良好的效果。  相似文献   

10.
汪小珍  李龙澍 《微机发展》2010,(2):37-39,43
模糊集理论是一种处理含糊和不确定性问题的数据分析方法,以其为理论基础的数据处理技术得到深刻关注和不断发展。信息检索致力于寻求准确、高效、智能的信息组织与存取方法,成为当今智能信息处理领域的重要研究内容。文档的信息检索过程实际上涉及文档集的表示、用户查询的表示、相似性匹配及其排序三部分,文中利用了模糊集理论中的模糊集合间中的包含关系——包含度定理,利用其中的“包含”关系体现了文档集和用户查询之间的匹配,给出一种信息检索方法,并用其包含度实现检索结果文档集的排序。  相似文献   

11.
12.
人体测量学并不是现代社会的产物。有着很长发展历史的人体比例理论中就包含了现代人体测量学的基本内容,尽管其还不够系统完整,但至少说明了在艺术创作中诞生的人体比例理论对现代人体测量学的影响。并随着时间的推移而不断的完善发展,为现代人体测量学的系统提出奠定了坚实的基础。  相似文献   

13.
目的:解决在FLASH中导入声音的问题.方法:对FLASH不支持的声音格式采取音频压缩的方法.结果:可成功将压缩后的声音文件导入到FLASH中.结论:在FLASH中使用声音可以使FLASH动画具有良好的动画效果.  相似文献   

14.
刘伟 《微计算机信息》2006,22(16):212-213
本文对于金属切削这一生产过程中所出现的不稳定问题,利用频率特性法中的奈氏判据,对其进行分析,从而找出消除自激振荡和达到切削过程绝对稳定的条件  相似文献   

15.
 The paper questions the ability of current university systems to respond appropriately to the complex demands of an Information Economy. It argues that new relationships between creative subjects and technology require new thinking about the nature and purpose of universities per se. In particular, attention is drawn to the growing involvement of the private sector in higher education. It is argued that it may not be appropriate to think of the `university of the future' in terms of current public sector and quasi public sector institutions, but rather in terms of an emporium, based on an international trade in educational services, and with the `University' as we now understand it occupying the functions of licensing, quality assurance and cultural custodianship. Accepted: 25 June 2002  相似文献   

16.
虚拟化技术是当今服务器技术的一个主流方向,也是一项在计算机领域具有革命性意义的技术.作为x86架构体系下虚拟化技术的领军者-VMware,在技术上有其独到之处.研究VMware的技术与应用,对探知其优秀的技术特点,了解其成熟的产品体系有着现实意义.  相似文献   

17.
All titanium alloys are highly reactive in the molten condition and so are usually melted in a water-cooled copper crucible to avoid contamination using processes such as Induction Skull Melting (ISM). These provide only limited superheat which, coupled with the surface turbulence inherent in most conventional mould filling processes, results in entrainment defects such as bubbles in the castings. To overcome these problems, a novel tilt-casting process has been developed in which the mould is attached directly to the ISM crucible holding the melt and the two are then rotated together to achieve a tranquil transfer of the metal into the mould. From the modelling point of view, this process involves complex three-phase flow, heat transfer and solidification. In this paper, the development of a numerical model of the tilt-casting process is presented featuring several novel algorithm developments introduced into a general CFD package (PHYSICA) to model the complex dynamic interaction of the liquid metal and melting atmosphere. These developments relate to the front tracking and heat transfer representations and to a casting-specific adaptation of the turbulence model to account for an advancing solid front. Calculations have been performed for a 0.4 m long turbine blade cast in a titanium aluminide alloy using different mould designs. It is shown that the feeder/basin configuration has a crucial influence on the casting quality. The computational results are validated against actual castings and are used to support an experimental programme. Although fluid flow and heat transfer are inseparable in a casting, the emphasis in this paper will be on the fluid dynamics of mould filling and its influence on cast quality rather than heat transfer and solidification which has been reported elsewhere.  相似文献   

18.
19.
本文将水的导电特性与集成编、译码技术结合讨论了集成编、译码器MC145026、MC145028在水位数字化检测领域中的应用原理。对该系统的结构、特点和工作原理作了较详细的介绍。  相似文献   

20.
李学良  朱志刚 《微计算机信息》2004,20(11):100-101,117
本文通过计量工作中用对等网实现多台微机电子秤的互联,实现数据的自动采集和共享,阐述了系统的硬件构成及软件设计,系统具有计量准确、快速、技术先进等特点,可大大提高工作效率,对企业实现计量管理网络化将起到有益的帮助。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号