首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
Infolite中文检索系统   总被引:9,自引:1,他引:8  
随着电子文本的大量涌现,人们对信息检索工具也提出了更高的 一个基于向量空间模型的中文信息检索系统的设计与实现,该系统既是我们用于中文信息检索研究的基础平台,也是开发实际应用系统的构件。  相似文献   

2.
随着互联网的发展,各国人民的交流日渐增多,跨语言信息检索变得日益重要。由于中文和英文的用户众多,汉英跨语言信息检索有着特别重要的意义。本文首先介绍信息检索的基本模型,然后介绍翻译和非翻译策略的跨语言信息检索技术,并给出一些汉英跨语言信息检索的难点问题。  相似文献   

3.
2005年度863信息检索评测方法研究和实施   总被引:1,自引:0,他引:1  
本次863中文信息检索评测的目的是检测互联网环境下大规模数据的中文信息检索技术的研究现状和系统有效性,中文与接口技术评测组综合考虑了目前信息检索面临的难点以及中文信息检索具有的特点设计了本次信息检索评测,本文详细描述了本次评测的组织过程,包括查询条件设计,语料库情况,标准答案查找方法以及评价指标和评测软件的介绍,通过对参评队伍的结果数据进行分析并结合查询条件的类型,本文还讨论了现有检索技术的优点以及存在的不足.  相似文献   

4.
隐含语义索引及其在中文文本处理中的应用研究   总被引:33,自引:0,他引:33  
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想,隐含语义索引是一种新型的信息检索模型,它通过奇异值分析,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰。实验和理论结果证实了隐含语义索引能够取得更好的检索效果。本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等。  相似文献   

5.
首先介绍了统计语言模型(SLM)的发展及常用的N元(n-gram)模型,对信息检索过程中的主要模型作了公式化描述并比较了不同模型,指出了它们之间及与传统概率检索方法的异同,分析了统计语言模型的弱点,最后介绍了对其可能的改进方法及最新研究进展,讨论了在中文信息检索中的应用和面对的挑战。  相似文献   

6.
基于概率潜在语义分析的中文信息检索   总被引:1,自引:1,他引:0       下载免费PDF全文
罗景  涂新辉 《计算机工程》2008,34(2):199-201
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立“文档-潜在语义-词”之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。  相似文献   

7.
基于p范式模型的检索   总被引:3,自引:0,他引:3  
随着电子文本的大量涌现,人们对信息检索工具提出了更高的要求。本文介绍一种扩展的布尔检索模型及其在中文信息检索系统中的应用,并利用相关反馈技术改善检索系统性能。  相似文献   

8.
和海莲  曾玉华 《福建电脑》2007,(7):63-63,75
传统的向量空间模型信息检索技术,只是简单的统计检索信息在文档中出现的频度,检索结果时常欠缺查全率与查准率,作者在此基础上提出了用户模型的建立方法,借助辅助个性化信息库设计了新的用户模型,改进了信息检索方法,提高了信息检索的智能化程度.  相似文献   

9.
利用人工和自动生成的资源进行中文信息检索查询扩展   总被引:4,自引:0,他引:4  
在中文信息检索的研究和实践中,由于查询与文件集中词的不匹配现象导致一些相关的文件不能被成功地检索出来,这是影响检索效果的一个很关键的问题。该文提出并实现了利用人工和自动生成的资源进行中文信息检索查询扩展,在NTCIR-2中文信息检索测试集上进行的实验表明,相对于不进行查询扩展的检索结果,该扩展方法取得了具有统计意义提高的检索效果。  相似文献   

10.
中文网页信息检索测试集的构建、分析及应用   总被引:1,自引:0,他引:1  
随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展。参考国外测试集的构建经验,我们构建了大规模中文网页信息检索测试集CWT,并组织了SEWM中文网页检索评测,希望在国内外各个研究小组的共同参与下建立并完善CWT,一起推动中文网页信息检索技术的发展。本文在调研和分析国内外现有研究进展的基础上,详细介绍了CWT的构建原则和方法,并对CWT进行了有效的统计分析和实验研究。本文提出的构建测试集的方法为以后的研究提供了参考。  相似文献   

11.
查询是对数据库中的记录进行选择和投影运算,得到满足条件的记录,是对数据库进行数据检索最常用的方法。如何简化查询语句的编写,提高数据查询效率是我们关心的问题,嵌套查询是解决复杂查询并实现高效查询的有效方法。  相似文献   

12.
遗传算法的运行机理分析   总被引:69,自引:0,他引:69  
遗传算法是一种自适应启发工群体型迭代式全局搜索算法,正受到许多学科的重视。本文首先以函数优化为例分析了遗传算法的运行过程,然后着重探讨了遗传算法的全局收敛性和效率问题,提出了有效基因的新概念及有效基因突变操作,推导出每次遗传搜索产生O(2^l-1)数量级的新模式,最后给出了结论。  相似文献   

13.
允许错误的(汉字)字符串快速检索技术   总被引:3,自引:1,他引:2       下载免费PDF全文
在计算机应用的诸多领域中都会遇到字符串似检索问题。本提出了一种技术。它通过应用搜索状态向量及字符-模式匹配向量,将字符串匹配比较转化简单的整数字位运算,有效地解决了字符/汉字串的相似匹配问题,中也给出了实现算法并分析了算法的复杂性。  相似文献   

14.
中文词句快速查找系统的研究与实现   总被引:2,自引:0,他引:2  
介绍了一种中文词句快速找系统该系统将中文文献转换为文献中每个汉字的位置列表,根据位置列表系统能够迅速地找出用户关心的某个词句在文献中的所有出现位置,并将该词句所在的上下文提供给用户。  相似文献   

15.
Grover提出的量子搜索算法,可以用O(N1/2)的时间复杂度完成对规模为N的非结构化数据集的搜索,这在经典计算机上需要O(N)的复杂度。其中量子黑盒(又称为Oracle)依赖于具体问题,根据数据库搜索的要求,设计了量子黑盒的内部结构和相应的量子线路,给出了适合于数据库搜索的量子算法。  相似文献   

16.
在自动化机器人的导航问题中,机器人必须在不具备全部信息或在不确定情况下反复作出决定且最终要找到未知环境中的目标;当机器人获得了全部信息时问题得到解决。研究多边形内目标的在线搜索问题,提出了一种用于查找星形多边形内未知目标的搜索策略,这一策略具有竞争比11.18,它独立于起始点和目标点所在的位置。  相似文献   

17.
关于汉字的两个分组查找算法   总被引:2,自引:1,他引:1  
处理汉字的以比较为基础的二分查找算法, 其复杂性为O(NlogN)。本文结合概率论知识, 提出汉字的随机分组查找算法和分组散列查找算法, 给出算法描述, 并证明其算法复杂性为O(N), 从而优于二分查找算法。最后给出实验结果。  相似文献   

18.
一个基于.Net的答疑系统的设计与实现   总被引:1,自引:0,他引:1  
分析了国内外答疑系统的现状和全文检索技术的最新发展,利用ASP.Net及ADO.Net技术构建了一个答疑系统并使用Lucene.Net技术实现了中文全文检索,提高了站点的检索效率。  相似文献   

19.
用于块匹配运动估计的SGDS算法   总被引:1,自引:0,他引:1  
基于搜索起点预测和梯度搜索,本文提出了正方形梯度下降搜索算法(SGDS)。实验结果表明,该算法可以较小的搜索代价取得与全搜索相当的效果,在搜索速度与搜索效果方面优于三步法(3SS)。  相似文献   

20.
用户协作式智能搜索模型的研究   总被引:2,自引:0,他引:2  
随着网络信息资源的日益膨胀和搜索引擎技术的不断发展,搜索引擎反馈的搜索结果也越来越多而使用户无所适从。为了有效提高搜索效率和搜索结果的准确性,该文提出一种基于用户协作的搜索结果优化模型。该优化模型将搜索引擎对搜索结果的处理同用户对搜索结果的挑选有机结合起来,搜索引擎可以根据用户的反馈信息不断地调整搜索结果,使搜索结果逐步满足用户的检索需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号