首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于改进TextTiling方法的用户新兴趣发现的研究   总被引:1,自引:0,他引:1  
个性化信息检索可以根据用户的检索兴趣返回个性化的检索结果.提出了用户新兴趣发现子任务,根据用户检索对象的变化识别包含新检索兴趣的查询.同时,引入TextTiling方法并对其进行改进,使系统可以自动选择合适的动态阈值并准确发现用户检索兴趣的转移.在构建的标准评测集上的实验结果表明,改进的TextTiling方法使得用户新兴趣发现系统性能提高了16.4%,而且此子任务使得最终的个性化检索系统的性能提高了3.8%.  相似文献   

2.
作为个性化服务技术的核心,用户模型的质量关系到个性化服务的质量。目前的用户模型大多只考虑用户的显式信息或隐式信息,很少同时考虑两者,使得检索质量不如人意。提出了一种新的基于日志分析的用户个性化模型,结合了传统的显式建模和隐式建模的优点,把显式个性化信息和隐式个性化信息通过两层树状结构结合起来。模型同时考虑了用户历史信息的长短期划分,以及检索系统返回结果的顺序和用户对结果页面的点击顺序。实验结果表明,基于该用户模型的个性化检索效果与原有检索系统的检索效果相比有显著提高。  相似文献   

3.
随着协同标注功能的普及,用户可以通过标注自己感兴趣的音乐实现个性化的分类管理,因此音乐共享系统中的社会化标签已成为互联网的重要资源。为了提高音乐检索系统的效率,综合考虑了社会化标签的特性及其对音乐检索模型的影响,利用了TLDA方法来进行标签聚类以获取更多的语义相关的标签,综合考虑了用户检索行为、歌词、音乐标签和音乐流行度来提高音乐信息检索系统的性能。实验表明,基于TLDA和SVSM的音乐检索模型相比于基于属性数据的音乐检索模型以及k-means标签聚类的模型,尤其是在音乐标签稀疏和非正规的情况下,能够在一定程度上提高音乐检索的性能。  相似文献   

4.
在使用本体技术构建知识资源检索系统的研发过程中,常会遇到检索结果同检索者本身实际情况不符,以及计算机难以理解用户实际需求的问题。为此,我们提出了一种基于本体的知识库个性化检索方法,将知识服务的本体构建、服务定义的过程同用户的个性化信息有机结合起来,并在服务执行的使用用户个性化信息来优化执行结果。实践表明,该方法可以比较精确的识别用户个性化需求,简化用户输入,提升查询结果质量。  相似文献   

5.
在使用本体技术构建知识资源检索系统的研发过程中,常会遇到检索结果同检索者本身实际情况不符,以及计算机难以理解用户实际需求的问题。为此,我们提出了一种基于本体的知识库个性化检索方法,将知识服务的本体构建、服务定义的过程同用户的个性化信息有机结合起来,并在服务执行的使用用户个性化信息来优化执行结果。实践表明,该方法可以比较精确的识别用户个性化需求,简化用户输入,提升查询结果质量。  相似文献   

6.
提出了基于神经网络的交互式图像检索方法,系统根据用户对检索结果的评价,动态构造神经网络,描述图像之间的相似性;图像间的这种相似性以及本次检索结果可以作为以后检索的历史信息保存在神经网络中,从而提高下一次检索的效率。实验表明,该方法嵌入到典型的图像检索系统中,改善了图像检索性能。  相似文献   

7.
基于Lucene的英汉跨语言信息检索   总被引:8,自引:0,他引:8  
描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检索性能的影响,基于Lucene全文索引工具包建立了搜索引擎。在系统评测方面,提出了一种根据主题,快速构建评测数据的方法。  相似文献   

8.
针对传统的采用关键词的信息检索方式在个性化方面的不足,提出了一种根据领域本体的个性化信息检索模型.首先获取用户的特征信息,接着利用用户的特征信息构建基于本体的用户兴趣模型,在检索过程中通过领域本体概念和用户兴趣模型对检索请求进行分析并对其进行扩展,获得符合检索意图的结果,在此基础上按兴趣度大小处理后将最终个性化信息检索结果反馈给用户.通过搭建关于本体的个性化检索原型系统,仿真结果验证了改进模型的有效性.  相似文献   

9.
分析了当前Internet信息检索的不足,探讨了Agent技术在网络信息检索方面的应用。充分考虑了信息检索过程中用户兴趣问题,提出了一个基于Agent的智能化检索系统的框架,该系统结合领域知识,运用多种用户兴趣学习算法,从而为用户提供个性化信息检索服务。  相似文献   

10.
传统图像检索系统中的图像标注与视觉特征存在语义鸿沟现象、未考虑图像标注的潜在语义联系,且检索界面显示效果不佳、个性化程度不高。针对上述问题,提出一种融合图像标注语义与图像视觉特征的个性化图像推荐模型。分析图像标注语义之间的关系,采用双曲空间和庞加莱磁盘模型进行图像可视化。实验结果证明,该模型具有可行性和有效性。  相似文献   

11.
传统的搜索引擎性能评价方法需要人工标注标准答案集,需花费大量的人力物力,并且评价结果依赖于人工标注的准确性,效率较低。该文基于聚类分析的思路,提出了一种搜索引擎性能评价指标和自动进行搜索引擎性能评价的方法,此方法能自动计算信息类查询的覆盖范围,并根据其覆盖范围对检索结果进行聚类,通过类间距和类内距等指标实现检索性能的自动评价。实验结果表明,基于聚类指标的评价方法与人工标注的评价方法的评价结果是相一致的。  相似文献   

12.
Sports video annotation is important for sports video semantic analysis such as event detection and personalization. In this paper, we propose a novel approach for sports video semantic annotation and personalized retrieval. Different from the state of the art sports video analysis methods which heavily rely on audio/visual features, the proposed approach incorporates web-casting text into sports video analysis. Compared with previous approaches, the contributions of our approach include the following. 1) The event detection accuracy is significantly improved due to the incorporation of web-casting text analysis. 2) The proposed approach is able to detect exact event boundary and extract event semantics that are very difficult or impossible to be handled by previous approaches. 3) The proposed method is able to create personalized summary from both general and specific point of view related to particular game, event, player or team according to user's preference. We present the framework of our approach and details of text analysis, video analysis, text/video alignment, and personalized retrieval. The experimental results on event boundary detection in sports video are encouraging and comparable to the manually selected events. The evaluation on personalized retrieval is effective in helping meet users' expectations.  相似文献   

13.
随着网络技术的发展,互联网中越来越多的资源被应用于信息检索中,大量的研究表明,社会化标注可以用于改善信息检索。现有个性化排序的方法中,用户之间的相似度大多通过其共同使用过的标签集来计算。然而,现实中用户标注数据存在稀疏性和标签同义词等问题,导致相似度计算并不准确。在前人研究的基础上,提出了一种融合主题域相似的个性化排序方法。该方法首先通过主题域的划分,将不同主题含义的网页及标签分开,通过构建的标签相似网络找出标签同义词。然后结合用户标签和主题偏好找出兴趣相近的用户,并对用户的标注信息进行扩展,从而能够有效地改善个性化信息检索的效果。在真实数据上的实验结果表明,该方法能有效缓解标注稀疏性和标签同义词问题,有助于改善用户检索体验。  相似文献   

14.
刘霞  阳小华 《数字社区&智能家居》2009,5(9):7079-7080,7083
分析传统的信息检索系统存在的不足及其原因,将本体加入到检索系统中,提出一个基于本体的个性化信息系统的设计思路和系统模型,并对该模型的主要模块进行了介绍,探讨了利用本体的领域知识和用户的本体模型实现信息检索的过程.最后对该模型进行的性能评价表明在查全率和查准率方面都有很大改善。  相似文献   

15.
分析传统的信息检索系统存在的不足及其原因,将本体加入到检索系统中,提出一个基于本体的个性化信息系统的设计思路和系统模型,并对该模型的主要模块进行了介绍,探讨了利用本体的领域知识和用户的本体模型实现信息检索的过程,最后对该模型进行的性能评价表明在查全率和查准率方面都有很大改善。  相似文献   

16.
Automatic image annotation (AIA), a highly popular topic in the field of information retrieval research, has experienced significant progress within the last decade. Yet, the lack of a standardized evaluation platform tailored to the needs of AIA, has hindered effective evaluation of its methods, especially for region-based AIA. Therefore in this paper, we introduce the segmented and annotated IAPR TC-12 benchmark; an extended resource for the evaluation of AIA methods as well as the analysis of their impact on multimedia information retrieval. We describe the methodology adopted for the manual segmentation and annotation of images, and present statistics for the extended collection. The extended collection is publicly available and can be used to evaluate a variety of tasks in addition to image annotation. We also propose a soft measure for the evaluation of annotation performance and identify future research areas in which this extended test collection is likely to make a contribution.  相似文献   

17.
18.
关系抽取是信息抽取中的一项基础任务,对信息检索、问答系统、知识图谱等有非常重要的意义。现有的关系抽取数据集存在包含类别太少、句子标注困难、不易扩展等缺陷,且只有英文数据集,不能很好地解决中文关系抽取任务。该文采用弱监督和半自动的方法,构建了一份中文关系抽取数据集,弥补了上述不足。首先借助维基百科抽取出丰富的关系对,从百度搜索返回结果及搜狗新闻语料中抽取包含实体对的句子,完成弱监督句子抽取过程。将句子放入RNN关系抽取系统进行打分,选取标注价值高的句子提交人工标注,对标注结果进行处理,最终得到中文关系抽取数据集。  相似文献   

19.
郎皓  王斌  李锦涛  丁凡 《软件学报》2008,19(2):291-300
目前,查询性能预测(predicting query performance,简称PQP)已经被认为是检索系统最重要的功能之一.近几年的研究和实验表明,PQP技术在文本检索领域有着广阔的发展前景和拓展空间.对文本检索中的PQP进行综述,重点论述其主要方法和关键技术.首先介绍了常用的实验语料和评价体系;然后介绍了影响查询性能的各方面因素;之后,按照基于检索前和检索后的分类体系概述了目前主要的PQP方法;简介了PQP在几个方面的应用;最后讨论了PQP所面临的一些挑战.  相似文献   

20.
This paper reports on methodological considerations and the results of the Information Retrieval (IR) project PADOK I and II. PADOK has been carried out by the Linguistic Information Science Group of the University of Regensburg (LIR) since November 1984 and has been sponsored by the German Ministry for Research and Technology. The long term objective is to integrate artificial intelligence topics and the methods of information retrieval research without neglecting traditional IR methodology. In PADOK we consider a type of mass data IR system which indexes its documents rather shallowly (freetext or morphological components) and adds an intelligent information retrieval component to this kernel system. So far we have obtained, on the basis of two large-scale retrieval tests of the German Patent Information System results which show how the linguistically based functions of an indexing system contribute to its performance, and indicate what is the most reasonable basic content analysis program for a German Patent Information System. This paper focusses on the general principles and aims of PADOK I and PADOK R and on the statistical evaluation of the retrieval tests.Christa Womser-Hacker has a Ph.D. in Linguistic Information Science. From 1985 until 1990 she was involved in several LIR-Projects concerning text processing, evaluation of the German Patent Information System, man-machine-interaction, intelligent interfaces for databases. Since May 1990 she has been an LIR staff member. She is interested in information retrieval, (statistical) evaluation methods of man-machine-interaction, intelligent interfaces. She has published Der PADOK-Retrieval-test (1989) and Die statistische Auswertung des Retrievaltests (1990).Jürgen Krause is professor of Linguistic Information Science at the University of Regensburg. He is a member of the editorial boards of the periodicals Computer and the Humanities and GLDV-Forum, and co-editor of Sprache and Computer. His research interests include office automation, artificial intelligence help system, information retrieval, evaluation of natural language systems. He is co-editor (with Christa Womser-Hacker) of Das Deutsche Patentinformationssystem, Entwicklungstendenzen, Retrievaltests and Bewertungen (1990) and co-editor of Computer Talk (1991).  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号