首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 765 毫秒
1.
基于XML的信息检索技术   总被引:1,自引:1,他引:1  
传统的信息检索方法无法为用户准确地提供所需的资料,这主要是由于传统的HTML网页结构上的缺陷造成的。文中通过比较HTML文档和XML文档在结构和语义上的差异,阐述了XML文档在信息检索技术中的优势和XML文档必将成为新一代网页模式的趋势。目前已经有很多权威编程工具和数据库支持从XML文档中抽取信息,越来越多的软件提供XML接口,文中以Microsoft公司的.NETFramework为例,介绍了如何从XML文档中检索信息。试验证明基于XML的信息检索技术较好地解决了Internet上资料获取的困难。  相似文献   

2.
基于XML的HTML自动阅卷算法设计与实现   总被引:1,自引:0,他引:1  
自动阅卷技术在当今计算机基础教育中起着重要作用。当前主流的基于文档对象模型的HTML网页自动阅卷方法存在准确性低及在大数据量时阅卷效率差的问题。文中介绍了一种基于XML的HTML网页自动阅卷算法,它根据XML与HTML格式上的相似性将HTML文件转换成XML文件,然后利用各种程序语言对XML良好的支持来进行HTML网页自动阅卷过程中的信息处理。该算法不仅可以避免传统人工阅卷的低效率及结果的主观性,而且在准确率及稳定性方面比文档对象模型方法有很大提高,为HTML网页制作考核提供了一种有效可行的方法。  相似文献   

3.
XML与HTML在Web环境中的应用分析   总被引:3,自引:0,他引:3  
林清  董占球 《计算机应用》2001,21(Z1):67-68
传统网页编程语言HTML已经越来越无法满足人们的各种需求,文中分析了HTML的局限性,从XML标准的产生背景出发,阐述了XML的特点及其优越性,并对XML在Web环境中的应用进行了详细论述.  相似文献   

4.
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一.主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础.  相似文献   

5.
XML语言在网页中的应用   总被引:1,自引:0,他引:1  
SGML是一种在互联网上发布信息所使用的"出版"语言,是所有计算机都能够理解的标准通用标记语言,目前流行的HTML、XML等语言是SGML的实际应用。本文对网页制作中使用的HTML、XML尤其是XML等标记语言相关知识做了介绍,比较了两种种语言的不同与优缺点。  相似文献   

6.
基于HTML和XML的信息提取方法研究   总被引:2,自引:0,他引:2  
陈红叶 《微机发展》2003,13(Z2):54-55
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础。  相似文献   

7.
随着XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究逐渐成为新的研究热点。XML文档本身含有的结构信息可以使其检索精度得到很大提高,但相应地,XML检索中使用的较复杂的评分模型(如组合语言模型和推理网络的结构化评分模型)和较细的返回结果粒度(由文档转变为元素或者段落),也使得传统的信息检索由I/O密集型应用转变为CPU密集型应用。针对上述应用特点的转变,提出了一种新的检索处理框架,即保存数据的两种索引形式,根据系统的状态动态地调整任务调度,平衡I/O和CPU的处理,以达到减少单个查询的平均响应时间的目的。  相似文献   

8.
基于扩展标记图的虚拟网页技术   总被引:2,自引:2,他引:0  
大量的Web信息资源采用HTML文档形式存放,带来诸多不利因素。其一,HTML文档因包含具体数据内容,不可避免地会涉及到数据冗余和一致性维护的问题。比如,在一个电子商场网站设计中,为服务于不同客户群,一双皮鞋的基础数据(厂家介绍、产品说明和图片等)可能会重复地放入多个网页中,如按分类、按品牌和按厂家等方式组织的网页。其二,HTML文档不利于构建新网页的重用,难以适应变化需求,如当有新客户群希望按老中幼年龄段来浏览商品时,新网页须从头组织,且可能产生新的数据冗余。其三,HTML文档的信息检索和查询优化较为困难。然而,关系数据模型中由于采用基表和视图技术,使类似问题得到很好解决。由此得到启发,提出了虚拟网页设计技术。通过建立素材库和定义扩展标记图,将网页的数据组织结构和具体内容分离,使问题得到较好解决。虚拟网页技术,还有利于借鉴标记图、OEM和OIM等数据模型已有研究成果,有利于Web查询语言和信息检索优化的研究。  相似文献   

9.
XML是数据处理的最新技术.WITSML是用于石油钻井的专用XML语汇,并且日益成为钻井数据传输和保存的标准语言.文中重点阐述了如何通过分析需求,参考已有标准,定义实用的XML钻井数据文档.同时介绍了XML钻井数据文档的表示和存储.  相似文献   

10.
基于XSL的转换技术提供了强大的机制和功能,可以实现多种文件变换.它具有部分高级编程语言的特征,因而利用XSL可以方便灵活地转换异构的超媒体XML文档.文中介绍了一个利用XML技术的超媒体课件系统,该系统使用XML保存课件内容,利用XSL来重新组织课件和指示课件对外表示的模式或风格,根据超媒体课件在不同场合不同情况下根据要求展现不同的外在风格和形式.通过应用XML及其XSL的超媒体文档格式转换,描述了基于XSL对超媒体课件文档的转换应用,并实现了基于XML的超媒体课件系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号