首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
一种基于IE缓存的Web图片获取方法   总被引:1,自引:0,他引:1  
当前基于网页的抓取技术只是简单地获取整个页面的HTML文件并抽取所需的文本信息,而对于其它MIME对象,如图片,特别是通过ASP、JSP或Servlet等服务器端组件查询后返回的图片对象,则很难获取。为了解决这个问题,提出了一种基于Internet Explorer缓存的Web图片获取方法:在Visual C++中采用多线程技术构造一个浏览器对象,将选定的样本图片页面在浏览器对象中打开,然后在IE缓存中搜索并获取所需的Web图片,最后将它存入Oracle数据库中分析使用。这种方法的优点是能够方便、快捷的获  相似文献   

2.
针对目前WinCE系统中的内嵌IE简化版浏览器不能浏览WAP网站和第三方软件Opera存在页面浏览不方便的问题,研究和设计了WinCE系统下手机WAP浏览器.该WAP浏览器采用了用户代理缓存、WML/HTML页面文件转换、HTML页面内容过滤相结合的预解析技术,在共用同一核心解析器的前提下,达到浏览WAP和Web站点的目的,并采用"软件分层结构,高内聚,低耦合"的思想进行设计和成功开发.实验结果表明,该WAP浏览器已基本能浏览WAP和Web站点,并且界面操作友好.  相似文献   

3.
随着Web应用被越来越广泛地使用,其稳定性也受到开发人员及用户的重视,其中很重要的一项指标是Web应用在不同浏览器中的兼容性问题。为了保证应用在所有的浏览器中都可以正常使用,在开发阶段对浏览器兼容性隐患进行检测就显得非常重要。为此,提出了一个在开发阶段可以自动检测Web应用界面跨浏览器兼容性问题的一项新技术,它可以自动浏览Web应用的所有页面,通过对同一页面在不同浏览器里所提取出的代码结构信息和相关属性的分析,生成差异报告,从而帮助开发人员更快地找到有兼容性问题的元素。完成了该方法的具体实现,并将其应用于一个具体的开发项目中来,收集相关的数据并验证该方法的可行性。最后根据实验数据归纳了常见的Web应用界面兼容性问题。  相似文献   

4.
郭孝园  何臻 《工矿自动化》2012,38(8):100-104
为了解决煤矿企业网站用户查找信息难的问题,提出了一种基于Web日志的煤矿企业网站个性化推荐服务模型。该模型应用关联规则对新用户进行页面推荐,应用聚类算法对老用户进行页面推荐;并结合点击网页的次数、网页的浏览时间、雅可系数与最长公共路径系数来度量用户兴趣度的方法,可为用户准确地推荐其感兴趣的页面。测试结果表明,该模型能够有效地对网页资源进行分类并进行个性化推荐。  相似文献   

5.
该文首先介绍了介绍Web知识挖掘的实现流程和数据挖掘的基本原理及方法,通过对Web知识的分析,引出基于Web挖掘的个性化信息推荐流程.然后研究了基于语义层次Web的个性化信息推荐的方法包括用户兴趣的感知方法、用于兴趣的捕获方法等,在此基础之上,利用导出语义层次的Web使用文档和生成个性化推荐的Web页面集,并详细介绍了...  相似文献   

6.
Web数据库技术进展   总被引:8,自引:0,他引:8  
一、引言 WWW是目前Internet上发展最快的领域,也是Internet网上最重要的信息检索手段。早期的Web页面(Home Page)主要用来传递静态HTML文档,后来由于CGI接口,特别是Java和JavaScript语言的引入,使得Web页面可以方便地传播动态信息。借助Java和JavaScript语言,可以设计出具有动画、声音、图形/图像和各种特殊效果的Web页面。 WWW的主要内容包括超文本传输协议(HTTP)、超文本标记语言(HTML)、通用网关接口(CGI)、Java和JavaScript语言等。 HTTP(Hyper Text Transfer Protocol),是一个专门为Web服务器和Web浏览器之间交换数据而设计的网络协议。它通过规定通用资源定位符(UBLs)使客户端的浏览器与服务器的Web资源建立链接关系,从而奠定  相似文献   

7.
为了提高Web开发效率,开发人员常常复用已有系统框架或成熟项目中现有的代码,但因此也导致了Web应用中总存在大量的冗余代码,冗余代码不仅影响程序的可读性和运行效率同时还会隐藏软件缺陷。通过研究Web应用源代码逻辑和框架的特性,提出了Web应用系统中基于源代码分析的冗余代码检测方法。从应用程序入口开始,根据代码之间的逻辑调用关系构建Web应用调用树,进而得到有效页面集、有效类与方法节点集;然后根据冗余检测算法检测出Web应用系统中冗余页面、冗余处理类与处理方法。为了评估冗余检测方法的有效性,包括漏检率与误检率,对两个JavaWeb应用进行冗余检测并通过人工注入冗余实验验证检测的有效性。实验结果证明,提出的冗余代码检测方法可以达到较高的检测效率。  相似文献   

8.
数据挖掘技术在Web预取中的应用研究   总被引:69,自引:0,他引:69  
WWW以其多媒体的传输及良好的交互性而倍受青睐,虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥护,用户的服务质量得不到很好的保证。为此文中提出了一种智能Web预取技术,它能够加快用户浏览Web页面时获取页面的速度。该技术通过简化的WWW数据模型表示用户浏览器缓冲器中的数据,在此基础上利用数据挖掘技术挖掘用户的兴趣关联规则,存放在兴趣关联知识库中,作为对用户行为进行预测的依据。在用户端,智能代理负责用户兴趣的挖掘及基于兴趣关联知识库的Web预取,从而对用户实现透明的浏览器加速。  相似文献   

9.
以PIC24FJ256GA106单片机为对象,研究基于MCU的Web服务器设计实现方法.提出了以16位PIC单片机驱动以太网控制芯片的设计方案,设计嵌入式Webserver的系统结构.在应用层以HTTP协议为基础,构建嵌入式Web服务器,实现了浏览器与Web服务器的动态交互过程.软件开发设计方面,采用MPLAB IDE集成开发环境.最后将设计的嵌入式Web服务器应用于B/S模式的网络安防系统中,试验调试结果表明了这种方法的有效性,验证了传输功能的可靠性和稳定性、Web页面的实现等等.  相似文献   

10.
Intenet的快速增长导致了个性化服务的需求急剧增加.基于页面结构的信息提取与推荐是Web数据挖掘中三大研究领域之一.该研究的关键技术是识别Web页面的组织形式,从中挖掘所需要的个性化页面信息.基于Web数据挖掘的个性化信息推荐系统可以满足互联网未来发展趋势的需要.与传统的以页面为单位的Web信息提取相比,基于页面结构分区的信息推荐更符合实际情况,粒度优势明显.以一组数据为实例阐述了基于Web挖掘的协同过滤推荐算法是如何进行数据表示、近邻查询以及产生推荐页面分区信息的.  相似文献   

11.
随着Internet技术的不断发展和网上电子文本的日益增多,面对互联网海量的信息,政府机关、企事业单位和研究机构都迫切希望获取与自身工作相关的有价值的信息,如何方便快捷地获取这些信息变得至关重要。该文基于visual C++,根据预定义的抓取规则,实现矿产资源相关信息的快速抓取。该文主要研究的是基于Web的矿产资源行情自动抓取技术,通过分析网页源代码,提取有用、有效的数据信息。  相似文献   

12.
为进一步解决在半结构化的Web页面中抽取Web碎片信息的困难,针对Web页面设计的目的是给用户显示相关的信息,浏览器只是呈现的中间手段,在抽取Web碎片信息时应该"以人为本",从"人"的视觉效果出发,将Web页面按照CSS视觉效果进行分块,提出一种基于CSS视觉分块的Web碎片信息抽取算法。以随机输入的1000个Web碎片信息站点作为实验对象,实验结果表明,算法具有良好的性能,达到了较高的召回率与查准率。  相似文献   

13.
Web信息系统中的资源访问控制   总被引:6,自引:1,他引:5  
0 引言基于Web的事务处理系统中,用户所获取的信息应该是可控的,他们只能获取自己权限范围内所能获取的资源。在一个系统中,如何使用户的视野受到严格的控制是权限管理的关键问题。在普通的Client/Server结构的MIS系统中,用户的权限控制是通过定义用户可以获取和修改的资源来加以控制的。在基于Web的事务处理系统中,也可以采用同样的思路。在Web上,所有的信息都是通过HTML主页表达在用户的浏览器上的。根据HTML的特征,我们把用户资源分为三类:  相似文献   

14.
本文提出了基于关联规则的挖掘最大频繁访问的新算法——s-Tree算法,并以此去分析用户的访问模式,挖掘出特定用户访问模式和浏览偏爱路径信息,进而优化站点结构,为用户提供“一对一”个性化的Web页面访问预测及内容推荐。  相似文献   

15.
一般情况下,Web 设计者首先对一个页面设计进行构思,然后着力实现该设计并为每一位站点访问者呈现同样的页面,而不管访问者使用的是哪种浏览器或平台。为了达到统一页面呈现这一目标,设计者往往要采用各种样式的 CSS 代码、浏览器检测脚本及其他手法和技巧。但是现在,我们需要重新评估这种方法,并质疑Web 页面对每位访问者看起来都一样这样的企图是否适用以及恰当了。承认差异Web 页面呈现的差异是一个不可避免的事实。现在,您在显示器、电视、PDA  相似文献   

16.
随着Web应用的日益普及,及可执行此类应用程序的浏览器越来越多,版本也在不断更新,Web应用的跨浏览器不兼容(Cross Browser Incompatibilities,XBI)已成为Web应用开发者面临的严重问题。提出一种结合DOM(Document Object Model)结构分析和页面元素(Screen Element)的计算机视觉分析方法,实现Web应用的跨浏览器兼容性测试XBCT(Cross-Browser Compatibility Testing),和现有的测试方法比较,实验结果表明了所提方法能够提高测试结果的准确性。  相似文献   

17.
基于Web页面链接和标签的聚类方法   总被引:1,自引:0,他引:1  
针对目前Web聚类效率和准确率不高的问题,提出一种基于Web页面链接结构和标签信息的聚类方法CWPBLT(clustering web pages based on their links and tags),它是通过分析Web页面中的链接结构和重要标签信息来比较页面之间的相似度,从而对Web站点中的Web页面进行聚类,聚类过程同时兼顾了Web页面结构和页面标签提供的内容信息.实验结果表明,该方法有效地提高了聚类的时间效率和准确性,是对以往仅基于页面主题内容或页面结构聚类方法的改进.  相似文献   

18.
基于模型的Web页面自动生成系统PAGS   总被引:2,自引:0,他引:2  
如何提高页面开发效率进而提高Web应用开发的效率成为Web应用开发者们关心的一个问题。现有的页面辅助开发工具大多由页面编辑工具改进而来,采用手动布局和数据绑定的方式定制页面,虽然方便了单个页面的开发,但工程的整体效率并未得到实质性的提高。PAGS是一种基于模型的页面自动生成系统,它通过对Web页面及页面组件的分类建立模型,结合数据字典技术和代码自动生成技术,实现了页面的自动生成、自动布局、自动绑定数据,同时也支持以图形化的方式对页面进行局部调整和修改。工程实践表明,PAGS能够较好地支持各类大型Web应用系统的页面开发需求,有效提高Web页面的开发效率。  相似文献   

19.
获取模式信息是深入研究Deep Web数据的必要步骤,针对Deep Web结果模式结构信息的丢失问题,提出了一种基于启发式信息的Deep Web结果模式获取方法.通过解析Deep Web结果页面数据,利用启发式信息为结果页面数据添加正确的属性名,进而得到对应Deep Web的结果模式,并对其进行规范化处理,解决不同数据...  相似文献   

20.
基于子树匹配的交互式Web数据抽取方法   总被引:4,自引:0,他引:4  
查询相关的Web页面中的数据记录之间具有极高的代码结构相似性。Web数据记录对应的DOM子树之间自然也就具有很高的结构相似性。针对查询相关的Web页面的特点,提出了一种基于DOM子树匹配的交互式Web数据抽取方法,实验证明,该方法能保证很高的数据抽取查全率和准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号