首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
互联网的飞速发展,为广大用户提供了庞大的信息资源,但要从这么大的资源库中寻找到自己需要的内容却是非常难.本文提出一种利用搜集器来搜集互联网中的多媒体资源,并且从中提取有利于资源描述的文本信息,建立多媒体资源库,为师生提供检索服务.  相似文献   

2.
陈建国 《计算机科学》2005,32(11):136-138
互联网提供了丰富的信息资源,为用户提供了很大选择范围,但同时也增大了选择的难度,提供一种快速精确的搜索工具,帮助用户在这些信息资源中获得有用的信息很有必要。文中介绍的网络信息管理系统就是这样一种全新、高效的重组信息资源结构和流程的工具,它能把不同来源、不同内容和不同结构的数据信息有机地整合在后台数据库中,实现互联网信息和本地资源信息的整合、组织、检索和管理功能,从而帮助用户快速获得准确的银行资讯。本文首先讨论了网络信息管理系统的工作原理,并对银行资讯网络信息管理系统的总体架构、体系结构和功能模块进行了分析。  相似文献   

3.
异构信息资源库的构建及其关键技术实现   总被引:4,自引:0,他引:4  
异构数据资源库的构建及其关键技术已成为系统集成和信息重用技术的重要内容.为了实现异构数据资源库底层信息的集成及共享,针对不同应用系统的异构数据,采用逆序树结构,改进了树型结构的存储方式,以逆序树加层号的方式实现任意层次树状结构的关系数据库存储,提高了数据库存储的树型结构的读取还原速度,解决了快速重建技术;在关系型数据库中,结合树结构设计了基于二进制大对象(BLOB)的相对抽象、通用的数据存储格式;结合基于BLOB存储及树状结构管理的方法,提出了对异构数据的资源组织、资源访问和安全管理等一系列关键技术的实现方案;在此基础上,构建了面向快速设计的网络资源库平台.该平台有效地实现了信息资源的存储、共享、服务和管理功能,提高了信息资源的综合应用水平.  相似文献   

4.
《软件》2016,(11):114-117
随着海量文本的涌现,信息超载和信息提取速度慢等问题促使了文本可视化技术的出现。文本可视化通过对文本资源的分析,提取信息,并以图形化方式呈现出来,为人们提供了一种快速获取文本关键信息的有效手段。在介绍了文本可视化的概念和重要性的基础上,着重阐述了基于词频统计的中文文本可视化的实现方法。基于某微博账户的微博数据,首先使用TF-IDF算法进行关键词提取,得到带有权重的词语,然后基于SVG技术和四叉树算法,实现了文本布局算法。最后得到的可视化效果良好,能全面、直观地反映出用户的兴趣和关注点。  相似文献   

5.
目前关于商品评论的深度网络模型难以有效利用评论中的用户信息和产品信息。提出一种基于注意力交互机制的层次网络(HNAIM)模型。该模型利用层次网络对不同粒度语义信息进行提取,并通过注意力交互机制在层次网络中通过捕捉用户、产品中的重要特征来帮助提取文本特征。最终将用户视角下的损失值和产品视角下的损失值作为辅助分类信息,并利用层次网络输出的针对用户或产品的关键文本特征进行训练和分类。三个公开数据集上对比结果表明,该模型较相关模型而言效果均有提升。  相似文献   

6.
研究基于网络的文本知识发现,根据搜索引擎分类内容的特点,通过几种常用搜索引擎的比较,结合文本分类的特点,发现单纯搜索文本信息资源的引擎更适合于文本分类;进而给出基于文本分类的网络信息获取原型,提出基于元数据的用户感兴趣知识的提取模式,用户可以根据实际情况在给定范围内提取自己感兴趣的文本信息,从而提高文本信息挖掘的精准性。  相似文献   

7.
本文提出了一种信息共享联盟模型UIS,对模型的结构、功能框架以及相关核心技术,包括异构数据库的标准化处理、URI远程访问技术、快速查询算法等进行了详细讨论.UIS的一个重要特点是:在逻辑上将各个信息资源的异构数据连接在一起,在物理上则对加盟数据按照元数据规范标准进行整合,并备份上传至联盟.该模型通过多主体协作,能够有效地整合异构、分散的数据库,实现信息资源的有效共享和有效检索.模型服务提供了多种模式的信息检索接口.对于已经共享的多媒体资源,通过引入颌域专家的知识问答命题来引导用户的学习,由此实现了教与学之间的互动,提高用户的学习质量.目前UIS已在中国农村科技信息网中进行实验和应用,实现了包括位于北京的"中国现代农业科技信息共享示范网"、"九亿网"、"国家农业科技园区网"等多家网站在内的数据库资源的信息共享,并且在河北省进行了试点,初步建立了中国农业信息共享联盟体系.  相似文献   

8.
校园多媒体教学网络资源库设计、建设与应用研究   总被引:14,自引:0,他引:14  
为了实现多媒体网络教学的核心技术-多媒体资源库的建设,有效地运用MPEG-1或MPEG-2频信息数据流于教学应用中。通过校园多媒体教学网络系统相关运行参数的计算,提出了多媒体资源库设计的基本方法和计算步骤,以及围绕多媒体资源库开展的教学应用研究。  相似文献   

9.
基于Lucene的全文检索构件的研究与实现   总被引:2,自引:0,他引:2  
Lucene是一个高效全文检索工具包,但它不能直接处理文件和数据库。主要研究Lucene的体系架构及其索引的不足之处,并在其基础上设计实现了一个全文检索构件。该构件能够直接对文件及数据库进行全文检索,使用户在不用编写程序的情况下,快速为自己的桌面系统或Web系统添加全文检索功能。使用插件架构,同时实现了多媒体文本提取插件。  相似文献   

10.
随着Internet技术的快速发展,Web数据库数目庞大而且仍在快速增长。为有效组织利用深藏于Web数据库上的信息,需对其按领域进行分类和集成。Web页面上的查询接口是网络用户访问Web数据库的唯一途径,对Deep Web数据源分类可通过对查询接口分类实现。为此,提出一种基于查询接口文本VSM(Vector Space Model)的分类方法。首先,使用查询接口文本信息构建向量空间模型,然后通过典型的数据挖掘分类算法训练分类器,从而实现对查询接口所属领域进行分类。实验结果表明给出的方法具有良好的分类性能。  相似文献   

11.
随着人工智能的发展,文字识别技术一方面有助于存储文本信息,一方面有助于机器对文本内容理解。文字识别技术在不断改进的同时,也被寄予更高的要求。相对于传统字符识别,一种序列文字识别方法将会更有效。因此,提出一种基于深度学习的端到端序列文字识别方法。为提取序列文本中的信息,也考虑到深度学习的运算量和运算资源,序列文本中的时序信息使用GRU网络提取,有效利用了文本中的时序关系。通过该方法,获得了非常好的识别效果。  相似文献   

12.
基于网络资源与用户行为信息的领域术语提取   总被引:1,自引:0,他引:1  
领域术语是反映领域特征的词语.领域术语自动抽取是自然语言处理中的一项重要任务,可以应用在领域本体抽取、专业搜索、文本分类、类语言建模等诸多研究领域,利用互联网上大规模的特定领域语料来构建领域词典成为一项既有挑战性又有实际价值的工作.当前,领域术语提取工作所利用的网络语料主要是网页对应的正文,但是由于网页正文信息抽取所面临的难题会影响领域术语抽取的效果,那么利用网页的锚文本和查询文本替代网页正文进行领域术语抽取,则可以避免网页正文信息抽取所面临的难题.针对锚文本和查询文本所存在的文本长度过短、语义信息不足等缺点,提出一种适用于各种类型网络数据及网络用户行为数据的领域数据提取方法,并使用该方法基于提取到的网页正文数据、网页锚文本数据、用户查询信息数据、用户浏览信息数据等开展了领域术语提取工作,重点考察不同类型网络资源和用户行为信息对领域术语提取工作的效果差异.在海量规模真实网络数据上的实验结果表明,基于用户查询信息和用户浏览过的锚文本信息比基于网页正文提取技术得到的正文取得了更好的领域术语提取效果.  相似文献   

13.
为实现文本信息检索中的个性化推荐,本文以用户焦点作为用户个性特征的描述,设计了适用于快速分类的混合前向角分类神经元网络RealCC。以用户焦点作为样本数据训练该网络后,可以通过该网络对用户查询结果进行快速分类以获得每务查询结果的推荐优先级。给出了使用用户焦点训练该网络的算法。实验表明,RealCC可以在保持分类精度的同时快速的完成对数据的分类,同时,基于用户焦点的个性化推荐,可以有效地减轻用户因从包含大量无关信息的查询结果中筛选感兴趣信息而产生的负担,较好地满足了用户对文本信息检索的时间要求。  相似文献   

14.
当前信息环境下,非结构化文本是各类信息的重要组成部分,如何针对用户信息需求,从文本数据中快速提取所需信息,为用户提供快速高效的信息获取方式成了当前信息服务领域亟待解决的问题.该文基于语义检索以及抽取式文档阅读理解模型,研究了如何快速有效地从大型文档库中根据用户问题提取出所需答案信息的技术,构建了基于文档库的信息服务问答系统.对于解决当前海量信息环境下快速有效的帮助用户获取所需信息,提升信息服务效率具有重要意义.实验表明,该系统可以快速精确的定位用户所提问题的答案,帮助用户快速有效的获取所需信息.  相似文献   

15.
多媒体网络教学资源库平台是把计算机技术、多媒体技术、网络技术和现代教学方法有机结合起来的一种教学资源库平台。本文研究的多媒体网络教学资源库平台是以高校公共课——ACCESS数据库应用基础为案例基于WEB技术搭建,主要包括课程教学、实验教学、教学资源、课程考试、成绩查询、在线答疑等环节。该平台的建成和应用对案例课程的教学资源共享、情境探究式教学、自主学习、丰富教学内容、提高教学质量和效益、实现教育技术现代化起到了积极作用。  相似文献   

16.
因特网给我们提供了巨大的信息量,在信息量极其丰富的Web资源中,蕴涵着大量有用的知识信息.信息爆炸而知识匮乏是当今人们所面临的一个很重要的问题.通过搜索引擎来查找信息将不容易定位到用户最感兴趣的数据上.而通过wleb信息抽取的自动化实现,可以提高信息获得的效率.信息抽取可以从网络上分析和发现有用的信息,废弃冗余的数据,提取用户知识领域的知识.本文分析了基于XML的web信息提取,讨论了相关技术在Web信息抽取中的应用并建立了相应的Web信息抽取摸型,通过自动学习来获取信息抽取规则,实现Wleb信息的自动提取.  相似文献   

17.
网络信息资源以指数级增长,搜索引擎能使网络用户快速找到有用的信息。为更有效地利用网络资源,人们在搜索效率方面做了多方面的尝试,并行搜索引擎就是其中之一,它能够同时检索多个数据库。本文叙述了并行搜索引擎的实现方式,并将它与独立搜索引擎进行比较,力图为用户提供一种最有效的搜索策略。  相似文献   

18.
随着计算机及网络技术的广泛应用,数据库建设正朝着多媒体、网络化方向发展,而丰富多样的多媒体数据不像普通文本信息那样容易描述和查找,所以元数据在数据库资源管理和应用中扮演着越来越重要的角色。主要从理论与实践的角度,论述甘南藏区旅游资源数据库建设中DC元数据的应用。  相似文献   

19.
随着电子学习系统快速的发展,电子学习资源呈现爆炸式的增长,如何有效地组织海量电子学习资源成为构建高效电子学习系统的重要因素。针对现有资源库在资源组织方面存在的不足,提出了一个基于领域知识本体的电子学习资源库检索模型,该模型利用领域知识来构建领域知识本体库并通过抽取电子学习资源元数据构建元数据库,通过映射关系完成对电子学习资源的语义组织,并在此基础之上构建一个语义检索模型,以有效地解决现有电子学习资源检索中丢失语义背景的问题,使检索结果在查全率、查准率方面有所提高,更加符合用户的需求。  相似文献   

20.
为了提高机电资源库自动整合能力,构建机电资源库自动整合系统,提出一种基于多层架构的机电资源库自动整合系统设计方法。采用多层次的大数据融合方法进行机电资源库自动整合的算法设计,提取机电资源库的统计特征量,采用自适应有限元网格划分方法进行机电资源库的分类整合,建立机电资源库的自动整合多层构架模型,在B/S结构体系下进行机电资源库自动整合系统的底层数据库构造,采用交叉编译方法进行机电资源库自动整合系统的程序加载和自动控制,在嵌入式多层次架构体系下,实现机电资源库自动整合系统的软件开发设计。测试结果表明,该系统能有效实现机电资源库自动整合,信息融合度较高,资源信息召回性较好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号