共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
随着突发事件信息规模的不断增大,如何实现突发事件应急管理领域跨媒体数据的精准搜索是高效利用信息资源迫切需要解决的问题。提出突发事件跨媒体信息检索系统(ECIR),详细阐述系统架构、关键技术和具体实现。ECIR集成本体、互联网信息采集、图像语义检索、智能移动终端、垂直搜索等技术,采集互联网突发事件的跨媒体信息,进行跨媒体分析和索引,实现突发事件跨媒体信息的快速检索和提供移动终端的跨媒体信息检索服务,为突发事件应急信息的挖掘和融合提供科学准确的决策依据。 相似文献
3.
4.
《数字社区&智能家居》2008,(Z2)
海量异构文档的快速检索和细粒度、多维度控制信息的存取是面向行业应用的文档管理系统中的关键。本文利用Lucene.net开源全文检索引擎和Oracle数据库,设计并实现了一个基于B/S架构,能够保存文档密级、分类等多种信息文档组织与检索系统,实现了对海量异构文档数据的快速检索和存取,并实现了文档数据的逐文档按角色分等级权限管理。 相似文献
5.
6.
随着信息化水平不断提高,如何从海量信息中快速查找到所需内容成为当前研究的热点。在分析了全文检索基本原理及Lucene系统结构的基础上,提出了MVC模式的全文检索模型,并实现了一套基于SSH框架技术和Lucene搜索引擎的全文检索系统。该系统扩展了检索文档支持的类型,不仅可以对TXT、MS Office各类文档进行检索,还能对PDF、HTML、RTF等文档进行检索;改进了中文分词器,提高了中文分词效率与精确度;改善了人机交互方式,实现了类似百度、谷歌搜索显示功能,对搜索关键字进行高亮显示。系统应用情况表明,该系统创建索引效率高,具有较快的检索速度以及较全的检索结果。 相似文献
7.
当前,随着大数据的发展,数据包含的价值越来越丰富,如何对海量的数据实现毫秒级的关键字检索越来越被各个信息化系统所需要。因此,文中基于Elasticsearch作为框架,通过知识库检索引擎技术研究及应用实现,形成一套具备海量数据存储、自定义知识库接入、高效全文检索等特点的分布式全文搜索引擎系统解决上述问题。 相似文献
8.
9.
互联网跨媒体分析与检索:理论与算法 总被引:8,自引:4,他引:4
互联网信息不仅规模巨大,而且存在着十分广泛、错综复杂的交叉关联,呈现跨媒体特性.实现互联网中跨媒体数据的精确挖掘与检索是高效利用互联网资源迫切需要解决问题.文中对该领域所涉及的人脑认知跨媒体特性、多媒体检索标注与语义理解、跨媒体表达与识别、互联网跨媒体搜索以及海量数据处理机制等几个方面进行了综述,讨论了该领域目前存在问题和今后的发展趋势. 相似文献
10.
11.
所谓Web信息检索,是指在海量的网络信息中,搜索出符合用户需要的信息。这是一种快速查找的信息检索方式,但是存在的问题是缺乏个性化,因为用户在输入关键词之后,会检索出来大量的信息,真正符合用户需求的信息可能不会排列在靠前的位置,从而使用户搜寻所需信息变得困难。因此,为了更好的使用户检索到所需的信息,就有了个性化Web信息检索系统的研究。本文通过设计思想的阐述,提出了个性化Web信息检索系统的设计与实现。 相似文献
12.
针对难以在海量数据中快速定位目标数据的问题,田湾核电站对Elasticsearch这一搜索引擎技术进行研究,通过微服务架构设计模式和前后端分离的开发技术建立起三项具体数据应用,解决了数据索引和数据定位的问题,提升了工作效率。IT智能客服机器人平台建立起具备自动应答功能的在线服务平台,在线提供高效的IT服务,提升IT服务质量;智能化主数据检索平台将各类主数据资源统一汇总,实现在主数据层面的快速数据查找;集中系统日志检索分析平台实现对全部Web应用的日志收集、日志存储、日志分析和展示看板,提升应用管理效率。本文通过对搜索技术的研究,实现简单便捷的数据查询利用,为更多基于搜索技术的多数据应用场景提供参考。 相似文献
13.
如何在海量的图像、视频和音频数据中快速找到用户关心的内容是检索领域研究的热点之一.从体育视频结构的特点出发,分析并给出一种语义标注及分层索引方法,对于一个体育视频数据,可通过与特征库匹配自动完成视频数据标注.检索时根据分层分级结构索引,能快速定位搜索范围,并根据用户反馈信息,执行一个新的动态学习检索过程,提高检索效率. 相似文献
14.
当今的数字时代,数据的增长速度不断加快,人们面临着需要高效快速处理大量数据的问题,由此诞生分布式计算机系统框架Hadoop。图像搜索方面,在海量图像数据的环境下,基于内容的图像检索(CBIR)相比传统基于文本的图像检索更具优越性。Hadoop适用于图像文件数无限大的情况,因此本文在简单介绍Hadoop之后,详细的描述了基于Hdoop的CBIR系统的设计与实现,并给出了系统性能的测试结果。 相似文献
15.
海量信息资源的管理是电子政务建设的一个重要方面。在浙江省企业联合征信系统中通过引入"嵌入式全文检索引擎",构建"关系 全文"双引擎数据库存储平台,实现了海量数据的动态处理和实时对外服务。同时,在该系统的应用层上还采取了多种技术手段,切实保护海量信息资源,防止非法访问,保障整个系统的稳定运行。 相似文献
16.
17.
随着当前网络信息资源的急剧膨胀,传统的检索系统已经难以在处理海量数据时提供高效的、可靠的服务。针对该情况,设计并实现一个基于Solr的分布式全文检索系统。系统通过网络爬虫抓取网页信息,将抓取的信息储存为文本文件;然后利用Solr索引处理模块,在多台计算机节点上并行创建索引,有效地提高系统建立索引的速度;系统通过Zoo-keeper管理集群,将搜索模块设计为分布式,有效地提高检索性能;最后设计了友好的用户界面。目前,系统可以在百万数据量的环境下稳定运行,具有较强的实用价值。 相似文献
18.
《计算机与应用化学》2015,(7)
针对海量数据环境下单机检索低效问题,建立了对海量化合物快速检索的分布式计算模型,提出了基于分治策略的分段哈希算法。对于如分子量、脂水分配系数(lggP)等不适于用哈希检索的连续数值型数据,设计了连续属性离散化模型进行离散化处理。实验结果表明,在对化合物大文件进行检索时,该模型可快速有效地检索范围信息,避免了对海量数据的重复检索,大幅降低了化合物检索的内存及时间,具有稳定的可扩展性和高效性。 相似文献
19.
随着电力企业海量数字资源的日益增长,如何对多种媒体格式的数字资源进行统一管理并进行快速、准确的搜索是电力企业知识管理中面临的难点.传统的搜索方法主要是基于关键字匹配来查找并返回大量的信息,没有考虑语义信息和用户的个性化特征,因此无法为用户提供准确、个性化的学习资源,造成了学习资源和人力的严重浪费.为解决此问题,本文基于语义技术,用机器可处理的语义元数据描述各种异构资源,并提出了基于本体的电力知识跨媒体资源标注方法,可以有效的解决用户对多知识点联动检索的问题,实现了电力企业知识内部知识的转化和传递,最终实现知识的共享和重用. 相似文献