共查询到10条相似文献,搜索用时 593 毫秒
1.
2.
中文网页信息检索测试集的构建、分析及应用 总被引:1,自引:0,他引:1
随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展。参考国外测试集的构建经验,我们构建了大规模中文网页信息检索测试集CWT,并组织了SEWM中文网页检索评测,希望在国内外各个研究小组的共同参与下建立并完善CWT,一起推动中文网页信息检索技术的发展。本文在调研和分析国内外现有研究进展的基础上,详细介绍了CWT的构建原则和方法,并对CWT进行了有效的统计分析和实验研究。本文提出的构建测试集的方法为以后的研究提供了参考。 相似文献
3.
2005年度863计划中文信息处理与智能人机接口技术评测回顾 总被引:1,自引:0,他引:1
2005年度863计划中文信息处理与智能人机接口技术评测于2005年9月20-22日举行.本次评测涉及机器翻译、语音识别、信息检索三大类技术.本文给出了此次评测的组织过程、参评单位、评测方案、数据准备、结果分析等各方面总体情况,更详细的情况在本论文集收集的各分项评测报告中给出.与往年的863评测相比,本次评测的主要特点是全面采用了国际上通行的网上评测的方式,提供了大量的训练数据,并且在评测研讨会上为参评单位提供了更加充分的交流机会. 相似文献
4.
信息检索是MIS的重要功能。汉字的查询不同于字母和数字的查询,汉字的查询要比字母查询复杂得多,为了提高汉字的检索效率,本文探讨了基于汉字拼音的查询方法,阐述了基于同音和首字母的查询方法,给出了支持中文首字母简拼检索的数据字段设计方法。 相似文献
5.
战场态势时空数据引擎是基于时空数据库技术实现的,面向战场时空数据查询的战场态势辅助分析系统.针对时空数据库查询语言的复杂性,设计了战场态势时空数据引擎的中文查询系统,研究了中文查询任务到时空查询语句的映射过程,设计了时空查询词库,研究了分词算法,查询文法以及STQL生成方法.通过原型系统验证了中文查询技术的可行性,提高了时空数据库查询的可用性和易用性. 相似文献
6.
基于Web中文检索系统SEARCH2000的设计与实现 总被引:3,自引:0,他引:3
本文详细介绍Search 2000中文检索系统的设计思想及实现方法。与传统的全文检索系统相比,基于WEB的信息检索系统,具有许多全新的特征。页面为半结构化文档、页面通过超链接相互关联、页面的内容覆盖不同应用领域并且拥有大量专有名词和缩略词汇,这些特性成为影响查询精度的主要因素。针对Web的上述特性设计的Search2000全文检索系统,使用智能化的页面相关分析、评分技术,以及高效数据存取、压缩算法和知识库的支持,使其具有使用方便、查询时间短、查询精度高等特点。 相似文献
7.
8.
一个基于XML数据仓库系统的设计与实现 总被引:2,自引:0,他引:2
黄土高原数据仓库系统以分布式数据仓库为核心,包含多个异质数据源。系统采用中间件技术不仅提供多层次资源查询服务,并且还使用数据挖掘技术和信息检索技术对资源数据进行深加工,能够主动地为用户提供黄土高原生态环境咨询、评测、预测与决策支持服务。论文重点介绍了一种基于XML的统一模式查询语言———XUSQL,用以解决多数据源中多模式数据融合问题。XUSQL使得在数据仓库中的查询与数据源模式无关,把数据源和数据仓库隔离开,从而有利于构造分布式数据仓库,便于异质数据源之间数据融合以及数据源本身的结构调整。 相似文献
9.
10.
分类查询是网络信息检索的重要组成部分。文章介绍了一个中文网页分类查询系统的设计与实现方法。由于人工分类费时费力,而自动分类需要大量训练数据,因此在实现该系统时提出了一种基于用户推荐机制的解决方案。 相似文献