首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 65 毫秒
1.
代价敏感的列表排序算法   总被引:1,自引:0,他引:1  
排序学习是信息检索与机器学习中的研究热点之一.在信息检索中,预测排序列表中顶部排序非常重要.但是,排序学习中一类经典的排序算法——列表排序算法——无法强调预测排序列表中顶部排序.为了解决此问题,将代价敏感学习的思想融入到列表排序算法中,提出代价敏感的列表排序算法框架.该框架是在列表排序算法的损失函数中对文档引入权重,且基于性能评价指标NDCG计算文档的权重.在此基础之上,进一步证明了代价敏感的列表排序算法的损失函数是NDCG损失的上界.为了验证代价敏感的列表排序算法的有效性,在此框架下提出了一种代价敏感的ListMLE排序算法,并对该算法开展序保持与泛化性的理论研究工作,从理论上验证了该算法具有序保持特性.在基准数据集上的实验结果表明,在预测排序列表中顶部排序中,代价敏感的ListMLE比传统排序学习算法能取得更好的性能.  相似文献   

2.
3.
变分自编码器(variational autoencoder, VAE)近年来在推荐领域有着很成功的应用.这种非线性概率模型的优势在于它可以突破线性模型有限的建模能力,而线性模型目前仍然在协同过滤研究中占主导地位.尽管基于变分自编码器的推荐方法已经取得了优越的表现,但仍存在一些未解决的问题,例如无法针对隐式反馈的推荐数据为用户生成个性化的推荐排序列表.因此,通过借助多项式似然对变分自编码器实施基于列表的排序策略,提出了一种深度生成推荐模型.该模型具有同时生成点级隐式反馈数据并为每个用户创建列表式偏好排序的能力.为了将排序损失与变分自编码器损失结合起来,采取归一化累计损失增益(normalized cumulative loss gain, NDCG)作为排名损失,并通过平滑函数进行近似.在3个真实世界数据集上(MovieLens-100k,XuetangX和Jester)进行了实验.实验结果表明:结合了列表级排序的变分自编码器在推荐个性化列表所有评价指标上,相比于其他基线模型拥有更出色的表现.  相似文献   

4.
5.
在许多信息检索任务中,为了进一步提高检索性能,通常需要对检索到的文档进行重新排序,目前的排序学习方法主要集中在损失函数的构造上,而没有考虑特征之间的关系。该文将多通道深度卷积神经网络作用于文档列表排序学习方法,即ListCNN,实现了信息检索的精确重排序。由于从文档中提取的多个特征中有一些特征具有局部相关性和冗余性,因此,文中使用卷积神经网络来重新提取特征,以提高列表方法的性能。ListCNN架构考虑了原始文档特征的局部相关性,能够有效地重新提取代表性特征。在公共数据集LETOR 4.0上对ListCNN进行实验验证,结果表明其性能优于已有文档列表方法。  相似文献   

6.
识别和抽取Web列表中的关系信息   总被引:1,自引:1,他引:0  
有大量的关系信息存在于各种各样的Web列表中,但使用目前的搜索引擎却难以找到它们。本文提出了一种基于语义和数据特征的方法,用于识别和抽取Web列表中的关系信息。我们首先建立一个模型,描述所要的关系信息,然后寻找Web上的列表并估计它们是否包含所要的关系信息,当估计值足够大时.则从中抽取所要的关系信息。  相似文献   

7.
在IT行业迅速发展的今天,越来越多的企业正在考虑或建设不同程度的企业信息门户平台来进一步提升企业的核心竞争力,门户的很多技术得到了扩展和完善。该文重点讨论了门户技术中的列表功能,列表在本企业生产经营管理中的广泛应用,为企业提高工作效率和提升管理方面起到了重要作用。  相似文献   

8.
近年来,随着信息技术的发展,图像、文本、视频、音频等多媒体数据呈现出快速增长的趋势.当处理大量数据时,某些传统检索方法的效率可能会受到影响,并且无法在可接受的时间内获得令人满意的准确性.此外,海量的数据还导致了巨大的存储消耗问题.为了解决上述问题,哈希学习被提出.现有的哈希学习方法首先为数据生成二进制哈希码,并且在学习...  相似文献   

9.
文章针对列表类自动问题回答的任务要求,提出了一种基于短语检索和答案距离排序模型的列表类问题回答的方法。该短语检索模型在传统的TF/IDF检索模型上进行改进,提出了利用不同长度短语作为查询词的检索方法,能够返回更多包含正确答案的相关文档;答案的距离排序模型则利用答案与上下文词之间的距离作为排序的依据对答案列表进行排序,可以提高正确答案的排名。这两种模型地提出在一定程度上解决了如何在返回尽可能多的答案的同时保证答案质量的问题。实验结果表明利用这两种模型的列表类问题回答方法对系统的性能有显著提高。  相似文献   

10.
移动机器人主要依靠激光雷达采集的点云和摄像机采集的图像信息来感知周围环境.在极端天气或夜晚的情况下,摄像机采集图像会受到极大干扰;本文基于聚类典型相关分析(cluster-canonical correlation analysis,cluster–CCA)提出一种面向室外移动机器人的雷达图像跨模态检索技术,首先利用深度学习网络提取点云和图像的特征,然后使用聚类典型相关分析将两种模态的特征映射到子空间,最后计算欧氏距离进行检索,可以从图像数据库中检索得出与点云最相似的图像文件.本文所提出的方法在KITTI数据集上进行了验证,实现了从点云到图像的跨模态检索,结果验证了cluster–CCA在室外移动机器人雷达图像检索方面应用的有效性.  相似文献   

11.
Geographic Information Retrieval is concerned with retrieving documents in response to a spatially related query. This paper addresses the ranking of documents by both textual and spatial relevance. To this end, we introduce multi-dimensional scattered ranking, where textually and spatially similar documents are ranked spread in the list, instead of consecutively. The effect of this is that documents close together in the ranked list have less redundant information. We present various ranking methods of this type, efficient algorithms to implement them, and experiments to show the outcome of the methods.*This research is supported by the EU-IST Project No. IST-2001-35047 (SPIRIT).  相似文献   

12.
Listwise approaches are an important class of learning to rank, which utilizes automatic learning techniques to discover useful information. Most previous research on listwise approaches has focused on optimizing ranking models using weights and has used imprecisely labeled training data; optimizing ranking models using features was largely ignored thus the continuous performance improvement of these approaches was hindered. To address the limitations of previous listwise work, we propose a quasi-KNN model to discover the ranking of features and employ rank addition rule to calculate the weight of combination. On the basis of this, we propose three listwise algorithms, FeatureRank, BLFeatureRank, and DiffRank. The experimental results show that our proposed algorithms can be applied to a strict ordered ranking training set and gain better performance than state-of-the-art listwise algorithms.  相似文献   

13.
本文旨在解决数据资产管理系统中信息检索效率低、检索结果准确率低下的痛点,基于排序学习算法构建智能检索系统,提升检索结果和用户请求的相关性.对排序学习算法理论进行研究,对常用的排序学习算法进行相关优化,将分类问题扩展到文本排序问题之上,定义相关的目标函数及损失函数,使用机器学习的方法来提升检索结果的准确度.基于垂直分布式...  相似文献   

14.
程凡  李龙澍 《计算机工程》2011,37(23):165-167
基于Pairwise的排序算法得到的判别式模型准确率较低。为此,提出一种基于Listwise的新型排序算法。采用判别式模型,将基于1-slack的支持向量机作为算法框架,定义算法的优化目标。由于该目标的约束条件太多,难以直接优化,因此使用割平面法求解。对于算法内部寻找最违背排列的子问题,将其看作一个线性指派问题,采用匈牙利法求解。在基准数据集上的实验结果验证该算法的有效性和稳定性。  相似文献   

15.
P2P信息检索系统的查询结果排序与合并策略   总被引:3,自引:0,他引:3  
基于P2P信息检索系统的特性,提出了一种完全分布式的查询结果排序与合并策略.首先分析当前P2P信息检索系统查询结果排序和合并问题的根源;接着提出一种完全分布式的查询结果排序与合并策略,包括元数据管理策略、查询结果的排序与合并的实现;然后用详细的实验证明了该策略的有效性.  相似文献   

16.
查询词之间的距离较为接近的文档,相关的可能性更大,将这种距离信息用于信息检索模型的构造可有效提高检索的性能。然而直接估计查询词在文档中的距离需要大量的训练文本,且计算复杂度高。该文提出了一种结合句子级别检索的信息检索模型,将文档分为若干个窗口,通过计算句子和查询的相关度考察查询词在给定窗口中的共现性,该方法可增大那些查询词彼此靠近的文档的相关度,从而使得检索模型可返回更为相关的文档。标准数据集上的实验结果表明所提出的模型可以取得较好的性能。  相似文献   

17.
基于本体的地理信息查询和排序   总被引:4,自引:0,他引:4       下载免费PDF全文
虞为  曹加恒  陈俊鹏 《计算机工程》2007,33(21):157-159
建立了一个基于本体的地理信息查询系统(OGIIS)。通过对地理本体实例的语义推理和索引,OGIIS实现了对地理实体中语义关系的查询,解决了传统的地理信息查询中无法对语义关系进行查询和推理的问题,提高了地理空间语义网上对异构数据信息检索和查询的智能性和准确度。  相似文献   

18.
分析了当前Web信息检索的技术现状,指出检索效率不高的根本原因在于搜索引擎所采用的排序函数和标引词加权技术。介绍了传统的信息检索排序函数和标引词加权技术。分析了Web文档的特点,指出其主要形式HTML文档是一种结构化文档,结构由标签显式地定义,不同文档结构对检索性能的贡献不同。对本领域国内外学者的成果作了对比研究。最后探讨了Web信息检索排序函数及标引词加权技术的发展方向。  相似文献   

19.
Pagerank是评定网页等级的一种比较流行、比较重要的方法,但是随着网页数量指数增加,爬行所有的有用的网页变得越来越困难,结果是,网页的等级值的计算仅仅依靠整个网络中的一个子集,这样产生了不正确结果。因为存在不完整的信息(悬挂页面),这个情况是存在于计算当中的,为了克服这个不完整性,文章提出了pagerank算法的一种改进——页面预测分类法,并对此算法进行效率分析。这可以将不同类别的悬挂页面进行特殊的分析以至于整个链接结构能够比较准确的预测,而且,实验结果显示:与先前的pagerank算法相比这个算法达到了令人比较满意的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号