首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。  相似文献   

2.
基于统计机器翻译模型的查询扩展   总被引:1,自引:0,他引:1  
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。  相似文献   

3.
黄名选  蒋曹清 《电子学报》2018,46(12):3029-3036
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性.  相似文献   

4.
针对当前信息检索系统中存在查全率低和查准率低的问题,提出了一种基于分类和语义查询扩展的信息检索方法.该方法结合语义来实现用户检索的查询扩展,并使用文本分类技术辅助检索.实验结果表明,该方法相对传统方法可以提高查全率和查准率,具有较好的查询性能.  相似文献   

5.
为了解决传统查询扩展时查准率低下的问题,基于词义消歧技术提出一种综合扩展语义树和词频共现率的语义查询扩展方法.针对查询词歧义所带来的查询主题漂移现象,利用WordNet知识源及其领域信息进行查询词义消歧,进而根据WordNet的层次结构生成扩展语义树,产生候选扩展词,并根据待扩展词与用户查询的整体最大相关性原则最终确定扩展词及其权重,使得扩展词能够充分表达用户查询请求,提高查询匹配准确率.实验表明,该方法在保证查全率的同时获得了较高的查准率.  相似文献   

6.
搜索引擎已经成为Internet上非常有用的信息检索工具,而查询关键词的质量则是影响搜索效果的最重要的因素之一。相关词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。文章提出一种新的基于概念抽取的相关词推荐模型,该模型克服了传统相关词推荐模型的一些不足,提供精确度更高的相关词作为二次搜索关键词,使信息搜索达到更好的效果。  相似文献   

7.
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果.  相似文献   

8.
乔亚男  齐勇 《电子学报》2011,39(Z1):158-162
查询性能预测技术试图在进行费时的实际信息检索之前对特定查询的性能进行预测,以便根据预测结果在不影响查询所代表的信息需求的基础上对查询进行调整,提高最终检索结果的精确度.针对传统查询性能预测模型没有考虑查询词问语义关系的问题,本文提出了一种查询语义图辅助的信息检索性能预测模型,该模型将表征查询词间语义关系的查询语义图引入...  相似文献   

9.
基于项权值排序挖掘的跨语言查询扩展   总被引:1,自引:0,他引:1       下载免费PDF全文
黄名选  蒋曹清 《电子学报》2020,48(3):568-576
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能.  相似文献   

10.
黄名选 《电子学报》2021,49(7):1305-1313
针对自然语言处理中查询主题漂移和词不匹配问题,提出基于CSC(Copulas-based Support and Confidence)框架的关联模式挖掘与规则扩展算法,并将基于统计学分析的关联模式与具有上下文语义信息的词向量融合,提出关联模式挖掘与词向量学习融合的伪相关反馈查询扩展模型.该模型对伪相关反馈文档集挖掘规则扩展词,对初检文档集进行词嵌入学习训练得到词向量,计算规则扩展词与原查询的向量相似度,提取向量相似度不低于阈值的规则扩展词作为最终扩展词.实验结果表明,所提扩展模型能有效地减少查询主题漂移和词不匹配问题,提高检索性能,与现有基于关联模式的和基于词向量的查询扩展方法比较,MAP(Mean Average Precision)平均增幅最大可达17.52%,对短查询更有效.所提挖掘方法可用于其他文本挖掘任务和推荐系统,以提高其性能.  相似文献   

11.
本体论在Web信息检索中的应用   总被引:4,自引:3,他引:4  
文章提出了一种基于本体论的Web信息检索模型,它利用领域本体知识库对用户的查询要求进行语义扩展,并且将检索到的文档在语义层次上进一步过滤,从而克服了目前的检索工具仅提供基于关键字的检索.而忽视关键字本身语义信息所造成的错检和漏检。  相似文献   

12.
在网络时代,信息检索主要通过Internet搜索引擎进行。Internet提供了多种不同的检索工具,对用户最重要的就是熟悉这些工具的性能,掌握检索技巧,提高检索的命中率。在此从搜索引擎的工作原理开始,介绍了Google搜索引擎的使用方法,包括关键词的选择和几个检索的技巧,如逻辑检索、通配符检索等,能更快、更准确地获得所需要的信息。  相似文献   

13.
构建领域本体的首要任务是获取领域相关的概念,这些概念很多是由常用词典库中没有收录的领域合成词组成,因此抽取领域合成词对于领域本体的构建至关重要.本文基于语言规则和统计技术,提出一种结合改进互信息和语言模板的领域合成词抽取方法.首先利用改进的互信息算法抽取由多字词单位构成的高频次候选领域合成词,在此基础上,利用语言模板匹配抽取低频次候选领域合成词,最后由专家进行检验,得到领域合成词集.实验结果表明,该算法的领域合成词提取准确率达到88.22%,适用于从大规模网页文本中自动高效地抽取领域合成词.  相似文献   

14.
杨震  夏艳  陈晓勤 《电信科学》2011,27(12):57-62
在电信运营商的转型过程中,传统的114语音平台作为以用户需求为核心的信息服务平台逐渐引起了人们的重视,但传统的基于数据库的查询方式越来越不能满足现在的用户信息需求,语音平台的数据特点和服务特点也决定了基于语音平台的信息搜索和信息服务不同于互联网的信息搜索服务。本文根据话音平台信息服务的特点提出了服务话音平台的结构化小文本搜索引擎的设计思想,在充分考虑话音平台信息特点和服务特点的同时,从搜索算法和系统设计的角度设计了适合话音服务平台的结构化小文本搜索引擎。  相似文献   

15.
A Unified Relevance Feedback Framework for Web Image Retrieval   总被引:1,自引:0,他引:1  
Although relevance feedback (RF) has been extensively studied in the content-based image retrieval community, no commercial Web image search engines support RF because of scalability, efficiency, and effectiveness issues. In this paper, we propose a unified relevance feedback framework for Web image retrieval. Our framework shows advantage over traditional RF mechanisms in the following three aspects. First, during the RF process, both textual feature and visual feature are used in a sequential way. To seamlessly combine textual feature-based RF and visual feature-based RF, a query concept-dependent fusion strategy is automatically learned. Second, the textual feature-based RF mechanism employs an effective search result clustering (SRC) algorithm to obtain salient phrases, based on which we could construct an accurate and low-dimensional textual space for the resulting Web images. Thus, we could integrate RF into Web image retrieval in a practical way. Last, a new user interface (UI) is proposed to support implicit RF. On the one hand, unlike traditional RF UI which enforces users to make explicit judgment on the results, the new UI regards the users' click-through data as implicit relevance feedback in order to release burden from the users. On the other hand, unlike traditional RF UI which hardily substitutes subsequent results for previous ones, a recommendation scheme is used to help the users better understand the feedback process and to mitigate the possible waiting caused by RF. Experimental results on a database consisting of nearly three million Web images show that the proposed framework is wieldy, scalable, and effective.   相似文献   

16.
针对当前支持去重的属性加密方案既不支持云存储数据审计,又不支持过期用户撤销,且去重搜索和用户解密效率较低的问题,该文提出一种支持高效去重和审计的属性加密方案。该方案引入了第3方审计者对云存储数据的完整性进行检验,利用代理辅助用户撤销机制对过期用户进行撤销,又提出高效去重搜索树技术来提高去重搜索效率,并通过代理解密机制辅助用户解密。安全性分析表明该方案通过采用混合云架构,在公有云达到IND-CPA安全性,在私有云达到PRV-CDA安全性。性能分析表明该方案的去重搜索效率更高,用户的解密计算量较小。  相似文献   

17.
本文根据测量原理的不同将各种屏蔽电缆屏蔽特性测试的方法归纳为“场测试法”和“传输线测试法”两大类,并分别以混响室法和线注入法为代表比较分析了两类方法的异同和各自需要关注的一些问题。两种方法分别用屏蔽效能和表面转移阻抗来表征电缆的屏蔽效果,在实际运用中各有优劣,体现出很强的互补性。  相似文献   

18.
Dynamic spectrum leasing (DSL) has been proposed as a solution for better spectrum utilization. Most of the work focused on non-cooperative game to model primary/secondary users interactions in DSL approach. Some others introduced cooperative game just for secondary users (SUs). In this paper, both primary users (PUs) and SUs incentives and level of satisfactions are considered. Nash bargaining is developed with both PUs and SUs as bargainers. A simple pricing approach is introduced which makes the proposed method practically feasible. On one hand, SUs adjust their power regarding to price and tolerable interference which are announced by PU. On the other hand, PU adjusts its tolerable interference to maximize its profit. Simulation results verify the viability of proposed method.  相似文献   

19.
A fast minimal path active contour model   总被引:1,自引:0,他引:1  
A new minimal path active contour model for boundary extraction is presented. Implementing the new approach requires four steps (1) users place some initial end points on or near the desired boundary through an interactive interface; (2) a potential searching window is defined between two end points; (3) a graph search method based on conic curves is used to search the boundary; and (4) a “wriggling” procedure is used to calibrate the contour and reduce sensitivity of the search results on the selected initial end points. The last three steps are performed automatically. In the proposed approach, the potential window systematically provides a new node connection for the later graph search, which is different from the row-by-row and column-by-column methods used in the classical graph search. Furthermore, this graph search also suggests ways to design a “wriggling” procedure to evolve the contour in the direction nearly perpendicular to itself by creating a list of displacement vectors in the potential window. The proposed minimal path active contour model speeds up the search and reduces the “metrication error” frequently encountered in the classical graph search methods e.g., the dynamic programming minimal path (DPMP) method  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号