首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
黄名选  蒋曹清 《电子学报》2018,46(12):3029-3036
主题漂移和词不匹配是自然语言处理中一个难题,文本挖掘与信息检索的结合有助于解决该问题.鉴于此,本文提出一种基于完全加权正负关联模式挖掘的越-英跨语言查询译后扩展算法.该算法采用新的完全加权正负项集支持度和关联度计算方法以及模式评价框架,对初检用户相关反馈文档集挖掘与原查询词相关的正负关联模式,从模式中提取扩展词实现跨语言查询译后扩展.与现有基于伪相关反馈、加权关联模式挖掘的跨语言扩展算法比较,本文算法能有效地减少查询主题漂移和词不匹配问题,提高跨语言信息检索性能;本文模式挖掘方法可用于推荐系统,提高其准确性.  相似文献   

2.
黄名选 《电子学报》2021,49(7):1305-1313
针对自然语言处理中查询主题漂移和词不匹配问题,提出基于CSC(Copulas-based Support and Confidence)框架的关联模式挖掘与规则扩展算法,并将基于统计学分析的关联模式与具有上下文语义信息的词向量融合,提出关联模式挖掘与词向量学习融合的伪相关反馈查询扩展模型.该模型对伪相关反馈文档集挖掘规...  相似文献   

3.
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果.  相似文献   

4.
基于统计机器翻译模型的查询扩展   总被引:1,自引:0,他引:1  
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。  相似文献   

5.
在搜索引擎等实际的信息检索应用中,用户提交的查询请求通常都只包含很少的几个关键词,这会引起相关文档与用户查询之间的词不匹配问题,对检索性能有较严重的负面影响。该文在分析了查询产生模型的基础上,提出了一种新的基于统计机器翻译的查询扩展方法。通过统计机器翻译模型提取文档集中与查询词相关联的词,用以进行查询扩展。在TREC数据集上的试验结果表明:基于统计翻译的查询扩展方法不仅比不扩展的语言模型方法始终有12%~17%的提高,而且比流行的查询扩展方法-伪反馈也具有可比的平均准确率。  相似文献   

6.
一种基于分类和语义查询扩展的信息检索方法   总被引:1,自引:0,他引:1  
针对当前信息检索系统中存在查全率低和查准率低的问题,提出了一种基于分类和语义查询扩展的信息检索方法.该方法结合语义来实现用户检索的查询扩展,并使用文本分类技术辅助检索.实验结果表明,该方法相对传统方法可以提高查全率和查准率,具有较好的查询性能.  相似文献   

7.
一种基于概念的信息检索查询扩展   总被引:6,自引:2,他引:6  
文章针对信息检索中存在的查询词“表达差异”问题,提出一种基于概念的查询扩展方法。一方面将用户查询中使用的词或短语与文档中抽出的概念相连接加入原查询.同时将作为扩展词的概念进行分类查询并采用整合排序算法调整结果;另一方面引入概念图供用户手动调节来进行查询扩展,以达到查询优化的目的。试验结果表明。该方法适宜改进Web上的信息检索,相对没有扩展的查询可以大幅度提高查询精度。  相似文献   

8.
本文通过对自然语言处理领域基于web的跨语言检索的现状进行简要综述,重点分析基于web的跨语言信息检索的主要方法、技术难点.  相似文献   

9.
叶雪  梁娟 《电子设计工程》2021,29(17):135-138
针对英语跨语言信息检索中数据量大、数据检索困难等问题,提出了基于平行语料库的英汉跨语言信息检索系统的设计.对系统的结构进行分析,主要包括标题查询、短查询与长查询,并对其进行翻译处理.实现英汉跨语言信息检索系统的详细设计.设计了系统翻译算法,实现英汉跨语言的预处理、分析和翻译.并且设计索引模块,将索引文件写入到磁盘中对信...  相似文献   

10.
语言是将人类与其他生物区分开的的基本方式,做所有的生物中煤制油人类具有语言能力,人类的各种各样的行为都与语言有着密不可分的关系。人类的思维逻辑以语言为基础,人类的绝大部分历史、知识都是通过语言文字的形式记载并流传下来的。随着互联网时代的到来,这种为某种特定的目标而创造出来的语言,被融合在计算机科学领域与人工智能领域,自然查询语言是实现人与计算机之间用自然语言进行有效沟通的媒介,本文将详细介绍计算机自然语言处理技术与人工智能,深入分析计算机自然语言处理技术的重点、难点以及计算机理解自然查询语言时存在哪些问题,最后,展望计算机理解自然查询语言未来的发展方向。  相似文献   

11.
为了解决传统查询扩展时查准率低下的问题,基于词义消歧技术提出一种综合扩展语义树和词频共现率的语义查询扩展方法.针对查询词歧义所带来的查询主题漂移现象,利用WordNet知识源及其领域信息进行查询词义消歧,进而根据WordNet的层次结构生成扩展语义树,产生候选扩展词,并根据待扩展词与用户查询的整体最大相关性原则最终确定扩展词及其权重,使得扩展词能够充分表达用户查询请求,提高查询匹配准确率.实验表明,该方法在保证查全率的同时获得了较高的查准率.  相似文献   

12.
13.
为了解决面向话题的搜索问题,提出一种新的面向话题的检索技术。首先分析了面向话题的搜索技术所面临的问题,然后基于数据挖掘技术提出了解决方案。利用数据挖掘技术抽取文本的多层次语义特征,形成对文本的多精度表示,抽取的特征不仅包括单个词特征也包括多词特征。建立了一个示例检索系统,实验表明利用多层次文本特征能够很好地实现面向话题的文本检索。  相似文献   

14.
Web查询日志研究综述   总被引:1,自引:0,他引:1       下载免费PDF全文
付博  赵世奇  刘挺 《电子学报》2013,41(9):1800
本文对查询日志在相关领域内的研究现状与进展进行了总结。首先介绍了web查询日志的常用信息和公开的数据集;进而阐述了查询日志在web搜索、信息抽取等方面的相关研究,并对它们进行了细致的介绍和分析;最后指出基于查询日志研究所面临的问题和挑战。重在对基于查询日志研究的主流方法和前沿进展进行概括、比较和分析,以期对后续研究有所助益。  相似文献   

15.
SQL查询语句优化研究   总被引:1,自引:0,他引:1  
胡皓 《舰船电子对抗》2007,30(4):105-107
在关系数据库系统中,结构化查询语言(SQL)的查询效率一直是人们关注的焦点。首先分析了SQL优化的可行性,然后研究了SQL的优化原理,最后给出了几种SQL优化方法。  相似文献   

16.
With user-generated content, anyone can De a content creator. This phenomenon has infinitely increased the amount of information circulated online, and it is beeoming harder to efficiently obtain required information. In this paper, we describe how natural language processing and text mining can be parallelized using Hadoop and Message Passing Interface. We propose a parallel web text mining platform that processes massive amounts data quickly and efficiently. Our web knowledge service platform is designed to collect information about the IT and telecommunications industries from the web and process this in-formation using natural language processing and data-mining techniques.  相似文献   

17.
基于概念格的查询扩展词推荐   总被引:1,自引:0,他引:1  
概念格是一种擅长描述层次关系的数学工具,在规则提取和数据分析中有广泛的应用.引入概念格理论对页面——概念形式背景建立了数学模型,在概念格基础上提出了一种查询扩展词生成算法.利用概念格Hasse图以及关联规则置信度以较高的效率生成扩展词作为二次搜索关键词,使信息搜索达到更好的效果.该算法在Diggol智能元搜索引擎上予以实现,取得了良好的效果.  相似文献   

18.
SQL查询语句优化方法的研究   总被引:4,自引:0,他引:4  
介绍RDBMS优化器的执行策略和分析了影响SQL查询效率的因素的基础上 ,提出了优化SQL查询效率的基本方法 ,以提高数据库查询的执行效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号