首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着互联网的发展,各国人民的交流日渐增多,跨语言信息检索变得日益重要。由于中文和英文的用户众多,汉英跨语言信息检索有着特别重要的意义。本文首先介绍信息检索的基本模型,然后介绍翻译和非翻译策略的跨语言信息检索技术,并给出一些汉英跨语言信息检索的难点问题。  相似文献   

2.
跨语言信息检索研究进展   总被引:12,自引:0,他引:12  
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言问的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。  相似文献   

3.
基于本体的跨语言信息检索模型   总被引:19,自引:1,他引:19  
随着网络信息的日益丰富和用户需求的提高,人们已经不能满足于仅仅在同一语种中进行检索,跨语言的信息检索(CLIR)因而受到人们越来越多的关注。为此,本文提出了一种新的基于语义的跨语言信息检索模型Onto-CLIR,该模型在传统信息检索技术的基础上,利用本体来刻画不同语言中对应的领域知识,以解决从查询语言到检索语言之间转换过程中出现的语义损失和曲解等问题,从而保证在检索过程中能够有效地遵循用户的查询意图,获得预期的检索信息。本文以体育新闻检索为背景,以英文查询作为查询请求,检索来自新浪网的体育类新闻,结果表明采用基于本体的跨语言信息检索方法之后检索的查全率和查准率平均提高10个百分点左右,有效地改善了检索性能。  相似文献   

4.
1.前言随着科学技术迅猛发展,信息交流量与日俱增,人们开始广泛应用高速度、大容量的现代化工具——计算机进行信息处理。为使计算机能够应用于更广泛的用户,利用计算机高效率地进行各种语言信息处理已成为一个迫切需要研究的课题。由此,语言信息处理应运而生,成为一门新兴学科,其相关理论和方法研究在计算机科学与人工智能领域也显得尤其重要。自动的信息检索(Information Retrieval.IR)也作为语言信息处理研究领域的重要课题,越来越引起人们的兴趣与重视。人们希望用机器来实现信息自动检索,以解决人工方式带来的困难与复杂,如今正随着人们在语言信息处理领域里所取得的成果而变为现实。  相似文献   

5.
基于英汉机译实现跨语言信息检索   总被引:8,自引:0,他引:8  
随着日益增长的大量信息成为可利用的、用户面对查询一个多语种文本集合的情形,变得越来越普遍。这就产生一个非常重要的问题一以一种语言描述的用户查询与以不同语言书写的文本之间的匹配问题,也就是一种如何跨越语言界限的问题,即跨语言信息检索(Cross-Language Information Retrievat,CLIR)。针对该项任务建立了一个面向英汉的跨语言信息检索系统,并以此为基础提交了相关的几组运行结果。同时,结合所构建的汉语IR系统,实现完整的英一汉CLIR过程。  相似文献   

6.
基于隐含语义的个性化信息检索   总被引:3,自引:0,他引:3  
随着互连网上信息资源的极度膨胀,出现了各种各样的信息搜集工具给用户提供信息服务,但是目前的信息搜集系统在给用户提供信息服务时,很难根据用户的个人信息实现个性化的信息服务,不同的用户相同的查询请求,返回的查询结果是相同的,这给用户的使用带来了很大的不便,而隐含语义检索(LSI)可以利用关键词之间的语义信息完成信息的搜索。提出了利用LSI来进行个性化信息检索算法的几种实现方法,并通过实验验证了算法的有效性。  相似文献   

7.
基于Lucene的英汉跨语言信息检索   总被引:8,自引:0,他引:8  
描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检索性能的影响,基于Lucene全文索引工具包建立了搜索引擎。在系统评测方面,提出了一种根据主题,快速构建评测数据的方法。  相似文献   

8.
以跨语言信息检索需求为背景,介绍了目前语义词典及应用的概况,根据蒙古文互联网发展的现状,从应用需求出发,提出构建面向跨语言信息检索的蒙汉双语语义词典的重要性,并利用构建领域本体的方法给出蒙汉双语计算机术语语义词典的初步设计方法。  相似文献   

9.
重新审视跨语言信息检索   总被引:6,自引:1,他引:6  
阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视,进一步明确指出了跨语言信息检索中必须解决的核心问题,最后通过分析研究现状给出了未来可能的重点研究方向。  相似文献   

10.
个性化信息检索是十分有用的检索方法,用户模型能够表示用户个人的爱好与兴趣,有许多研究工作以各种方式使用用户模型扩充问句.提出一种新的基于一元语言模型的方法.它通过对包含多个主题域的长期用户模型的学习得到相关的语义内容,对问句进行扩展后进行检索,得到更接近用户兴趣的结果,然后再与伪相关反馈模型相结合,进一步提高检索性能.通过实验证明,该方法取得了较好的效果.  相似文献   

11.
基于P2P的个性化Web信息检索   总被引:2,自引:0,他引:2  
为了克服Web搜索引擎在可扩展性、协作性和个性化等方面存在的不足,提出了一种基于Peer to Peer 的全分布、协作式、自组织的个性化Web信息检索,定义了以查询主题为中心进行主题聚类、数据组织和查询路由的用户协作共享策略,设计了协作生成用户兴趣列表向量、对相似语义查询进行主题聚类和更新、基于查询集建立倒排索引以及基于查询主题进行语义路由等算法和机制,以提供人性化、协作式、个性化的搜索。模拟实验表明,原型系统可以加快查询速度,减轻网络负荷,提高搜索的准确率。  相似文献   

12.
Multimedia Tools and Applications - Approaches of query translation in Cross-Language Information Retrieval (CLIR) have frequently used dictionaries which suffer from translation ambiguity....  相似文献   

13.
14.
Kernel Canonical Correlation Analysis (KCCA) is a method of correlating linear relationship between two variables in a kernel defined feature space. A machine learning algorithm based on KCCA is studied for cross-language information retrieval. We apply the algorithm in Japanese–English cross-language information retrieval. The results are quite encouraging and are significantly better than those obtained by other state of the art methods. Computational complexity is an important issue when applying KCCA to large dataset as in information retrieval. We experimentally evaluate several methods to alleviate the problem of applying KCCA to large datasets. We also investigate cross-language document classification using KCCA as well as other methods. Our results show that it is feasible to use a classifier learned in one language to classify the documents in other languages.  相似文献   

15.
网络信息检索个性化服务的研究与设计   总被引:1,自引:0,他引:1  
针对目前网络信息检索个性化服务不够周全的缺点,提出并实现了一个提高服务质量的信息检索个性化服务模型。该模型主要通过用户兴趣模型的建立、多维权值排序算法MWRA的优化、自由方式推送用户信息模型的建立三大模块来实现。最后给出传统信息检索模式与新模式的实验结果。  相似文献   

16.
Due to the language barrier, non-English users are unable to retrieve the most updated medical information from the U.S. authoritative medical websites, such as PubMed and MedlinePlus. However, currently, there is no any cross-language medical information retrieval (CLMIR) system that can help Chinese-speaking consumers cross the language barrier in finding useful English medical information. A few CLMIR systems utilize MeSH (Medical Subject Headings) to help overcome the language barrier. Unfortunately, the traditional Chinese version of MeSH is currently unavailable.In this paper, we employ a semi-automatic term translation method to construct a Chinese–English MeSH by exploiting abundant multilingual Web resources, including Web anchor texts and search–result pages. Through this method, we have developed a Chinese–English Mesh Compilation System to assist knowledge engineers in compiling a Chinese–English medical thesaurus with more than 19,000 entries. Furthermore, this thesaurus has been used to develop a prototypical system for cross-language medical information retrieval, MMODE, which can help consumers retrieve top-quality English medical information using Chinese terms.  相似文献   

17.
18.
提出了一种新的相关反馈方法,该方法引入了Rnorm重排序机制。通过计算用户反馈的按个人兴趣排列的期望输出顺序与系统输出图像顺序之间的Rnorm值,来调整各个特征的权重,从而指导下一轮的检索。新方法不需标注,减轻了用户的负担,从而避免了用户是否愿意配合的问题,而且实验表明较Rui方法在性能上有很大提高。  相似文献   

19.
针对个性化图像检索的语义鸿沟问题,提出了一种新的用户兴趣模型的构建方法。将用户兴趣模型分为长期兴趣和短期兴趣:用户的短期兴趣由图像的低层特征映射得到;用户的长期兴趣经过推理机推理,将短期兴趣映射为高层语义得到,从而弥补语义鸿沟。实验结果表明,经过用户兴趣模型过滤的图像检索结果符合用户的个性化要求,相比已有方法在查准率和查全率上取得了明显的改善。  相似文献   

20.
Information filtering(IF) systems are important for personalized information service.Howerver,most current IF systems suffer from low quality and long training time,In this paper,a refined evolving information filtering method is presented.This method describes user‘s information need from multi-aspects and improves filtering quality through a process like natural seslction.Experimental result shows this method can shorten training time,improve filtering quality,and reduce the relevance between filtering results and training sequence.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号