共查询到20条相似文献,搜索用时 109 毫秒
1.
Infolite中文检索系统 总被引:9,自引:1,他引:8
随着电子文本的大量涌现,人们对信息检索工具也提出了更高的 一个基于向量空间模型的中文信息检索系统的设计与实现,该系统既是我们用于中文信息检索研究的基础平台,也是开发实际应用系统的构件。 相似文献
2.
随着互联网的发展,各国人民的交流日渐增多,跨语言信息检索变得日益重要。由于中文和英文的用户众多,汉英跨语言信息检索有着特别重要的意义。本文首先介绍信息检索的基本模型,然后介绍翻译和非翻译策略的跨语言信息检索技术,并给出一些汉英跨语言信息检索的难点问题。 相似文献
3.
4.
隐含语义索引及其在中文文本处理中的应用研究 总被引:33,自引:0,他引:33
信息检索本质上是语义检索,而传统信息检索系统都是基于独立词索引,因此检索效果并不理想,隐含语义索引是一种新型的信息检索模型,它通过奇异值分析,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度,使得文档之间的语义关系更为明晰。实验和理论结果证实了隐含语义索引能够取得更好的检索效果。本文论述了隐含语义索引的理论基础,研究了隐含语义索引在中文文本处理中的应用,包括中文文本检索、中文文本分类和中文文本聚类等。 相似文献
5.
首先介绍了统计语言模型(SLM)的发展及常用的N元(n-gram)模型,对信息检索过程中的主要模型作了公式化描述并比较了不同模型,指出了它们之间及与传统概率检索方法的异同,分析了统计语言模型的弱点,最后介绍了对其可能的改进方法及最新研究进展,讨论了在中文信息检索中的应用和面对的挑战。 相似文献
6.
7.
8.
传统的向量空间模型信息检索技术,只是简单的统计检索信息在文档中出现的频度,检索结果时常欠缺查全率与查准率,作者在此基础上提出了用户模型的建立方法,借助辅助个性化信息库设计了新的用户模型,改进了信息检索方法,提高了信息检索的智能化程度. 相似文献
9.
利用人工和自动生成的资源进行中文信息检索查询扩展 总被引:4,自引:0,他引:4
在中文信息检索的研究和实践中,由于查询与文件集中词的不匹配现象导致一些相关的文件不能被成功地检索出来,这是影响检索效果的一个很关键的问题。该文提出并实现了利用人工和自动生成的资源进行中文信息检索查询扩展,在NTCIR-2中文信息检索测试集上进行的实验表明,相对于不进行查询扩展的检索结果,该扩展方法取得了具有统计意义提高的检索效果。 相似文献
10.
中文网页信息检索测试集的构建、分析及应用 总被引:1,自引:0,他引:1
随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展。参考国外测试集的构建经验,我们构建了大规模中文网页信息检索测试集CWT,并组织了SEWM中文网页检索评测,希望在国内外各个研究小组的共同参与下建立并完善CWT,一起推动中文网页信息检索技术的发展。本文在调研和分析国内外现有研究进展的基础上,详细介绍了CWT的构建原则和方法,并对CWT进行了有效的统计分析和实验研究。本文提出的构建测试集的方法为以后的研究提供了参考。 相似文献
11.
查询是对数据库中的记录进行选择和投影运算,得到满足条件的记录,是对数据库进行数据检索最常用的方法。如何简化查询语句的编写,提高数据查询效率是我们关心的问题,嵌套查询是解决复杂查询并实现高效查询的有效方法。 相似文献
12.
遗传算法的运行机理分析 总被引:69,自引:0,他引:69
遗传算法是一种自适应启发工群体型迭代式全局搜索算法,正受到许多学科的重视。本文首先以函数优化为例分析了遗传算法的运行过程,然后着重探讨了遗传算法的全局收敛性和效率问题,提出了有效基因的新概念及有效基因突变操作,推导出每次遗传搜索产生O(2^l-1)数量级的新模式,最后给出了结论。 相似文献
13.
14.
中文词句快速查找系统的研究与实现 总被引:2,自引:0,他引:2
介绍了一种中文词句快速找系统该系统将中文文献转换为文献中每个汉字的位置列表,根据位置列表系统能够迅速地找出用户关心的某个词句在文献中的所有出现位置,并将该词句所在的上下文提供给用户。 相似文献
15.
Grover提出的量子搜索算法,可以用O(N1/2)的时间复杂度完成对规模为N的非结构化数据集的搜索,这在经典计算机上需要O(N)的复杂度。其中量子黑盒(又称为Oracle)依赖于具体问题,根据数据库搜索的要求,设计了量子黑盒的内部结构和相应的量子线路,给出了适合于数据库搜索的量子算法。 相似文献
16.
17.
关于汉字的两个分组查找算法 总被引:2,自引:1,他引:1
处理汉字的以比较为基础的二分查找算法, 其复杂性为O(NlogN)。本文结合概率论知识, 提出汉字的随机分组查找算法和分组散列查找算法, 给出算法描述, 并证明其算法复杂性为O(N), 从而优于二分查找算法。最后给出实验结果。 相似文献
18.
19.
用于块匹配运动估计的SGDS算法 总被引:1,自引:0,他引:1
基于搜索起点预测和梯度搜索,本文提出了正方形梯度下降搜索算法(SGDS)。实验结果表明,该算法可以较小的搜索代价取得与全搜索相当的效果,在搜索速度与搜索效果方面优于三步法(3SS)。 相似文献
20.
用户协作式智能搜索模型的研究 总被引:2,自引:0,他引:2
随着网络信息资源的日益膨胀和搜索引擎技术的不断发展,搜索引擎反馈的搜索结果也越来越多而使用户无所适从。为了有效提高搜索效率和搜索结果的准确性,该文提出一种基于用户协作的搜索结果优化模型。该优化模型将搜索引擎对搜索结果的处理同用户对搜索结果的挑选有机结合起来,搜索引擎可以根据用户的反馈信息不断地调整搜索结果,使搜索结果逐步满足用户的检索需求。 相似文献