首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
ASP页面资源搜集是对ASP应用进行访问控制的基础.提出了一种面向ASP页面的细粒度资源搜集算法,能够搜集到ASP页面内的HTML标签和脚本、组件等资源,并给出了算法实现的性能测试和结果分析.该算法为ASP页面资源细粒度的访问控制提供支持,具有较高的查全率和正确率.  相似文献   

2.
介绍了一种基于页面模型的引擎式快速页面构造服务,该服务在电力行业领域内具有先创性,其使得具有普通技术水平的开发人员,仅需要少量代码甚至不需要代码就可以构造出业务应用的页面及逻辑.本文重点阐述了页面构造服务中页面模型、页面设计器、运行引擎的原理及组成.该服务所支撑项目的实践结果表明,其可以有效提升开发效率、降低开发运维成本,并且具有良好的适应性和扩展性.  相似文献   

3.
因特网的迅速发展对传统的爬行器和搜索引擎提出了巨大的挑战。各种针对特定领域、特定人群的搜索引擎应运而生。Web主题信息搜索系统(网络蜘蛛)是主题搜索引擎的最主要的部分,它的任务是将搜集到的符合要求的Web页面返回给用户或保存在索引库中。Web 上的信息资源如此广泛,如何全面而高效地搜集到感兴趣的内容是网络蜘蛛的研究重点。提出了基于网页分块技术的主题爬行,实验结果表明,相对于其它的爬行算法,提出的算法具有较高的效率、爬准率、爬全率及穿越隧道的能力。  相似文献   

4.
该文研究论坛的增量搜集问题。由于在论坛中同一主题通常分布在多个页面上,而传统增量搜集技术的抓取策略通常是基于单个页面,因此这些技术并不适于对论坛增量搜集。该文通过对许多论坛中版块变化规律的统计分析,提出了基于版块的论坛增量搜集策略。该策略将属于同一版块的所有页面看做一个整体,以它做为抓取的基本单位。同时该策略利用版块权重和局部时间规律确定抓取频率和抓取时间点。实验结果表明本策略对新增和新回复帖子的平均召回率为99.3%,并且与平均调度方法相比系统总延迟最高可减小42%。  相似文献   

5.
网页抓取器是爬虫系统的一个重要部分,其性能的好坏直接影响着搜索引擎的性能.网页抓取器可以分为网络层和应用层,而网络层是关键.基于选取样本页面、定义规则和网页抓取的三个步骤,在linux下使用epoll技术实现了多线程的网页抓取,方法快速有效.  相似文献   

6.
国内综合性搜索引擎时新性的计算   总被引:3,自引:0,他引:3  
一个搜索引擎所索引Web页面的“新鲜性”已成为评价其系统性能的指标之一。该文利用北大天网的实际搜集和Cho所检测Web变化的实验数据,计算了国内综合性搜索引擎在定期全面搜集时的时新性。  相似文献   

7.
介绍了一种镇痛气体吸入器的设计及实现方法.该吸入器采用 AT89C55WD 单片机为控制核心,具备吸入气体流量实时显示,压力、流量双重触发.文中介绍了吸入器的系统组成和电路组成,并对单片机系统硬件结构及软件设计作了具体说明.  相似文献   

8.
针对PageRank算法不十分关注页面内容而只关注"超链分析"的现状,并存在着用户实际所需要的页面的次序并不靠前的问题,提出了一种搜索引擎页面排序融合算法.该算法通过考虑词项权重、链接分析和用户偏好3个主要方面,得到一个URL的权值评价,这样每个待搜集的网页都有自己的权值评价,超链选择程序根据这些权值,从中选出一个或一批权值最大的来搜集,以达到精确检索的目的.  相似文献   

9.
页面包装器自动生成的改进算法   总被引:1,自引:0,他引:1  
论文提出了一种页面包装器自动生成的改进算法,在对两个HTML页面进行匹配生成页面包装器的过程中,该算法使用树型数据模型作为基础,比原算法具有更高的执行效率。  相似文献   

10.
Web信息抽取引发了大规模的应用。基于包装器的Web信息抽取有两个研究领域:包装器产生和包装器平衡,提出了一种新的包装器自动平衡算法。它基于以下的观察:尽管页面有多种多样的变化方式,但是许多重要的页面特征在新页面都得到了保存,例如文本模式、注释信息和超级链接。新的算法能充分利用这些保存下来的页面特征在变化的页面中定位目标信息,并能自动修复失效的包装器。对实际Web站点信息抽取的实验表明,新的算法能有效地维持包装器的平衡以便更精确地抽取信息。  相似文献   

11.
陆璐  全君林  李玮超 《计算机工程》2010,36(23):113-115,118
设计一个基于客户端的恶意网页收集系统。系统通过设置主题爬虫,有针对性地获取可能包含恶意脚本的网页文件,通过分析恶意代码常见的挂木马方式与恶意代码样本,设计正则表达式来提取网页恶意代码的特征码,利用相应算法扫描并匹配利用爬虫获取的网页文件,如发现网页文件中包含可疑的恶意脚本,则将它的域名URL、恶意网页路径与恶意代码脚本类型存入恶意网页库中,以实现恶意网页的搜集。  相似文献   

12.
通过比较普通爬虫与主题爬虫,以主题相关性为核心设计搜集数码产品信息的主题爬虫。提出相似度和PageRank相结合的排序算法,从而保证所搜集网页的主题相关性,切返用户之需,为主题搜索引擎的实现奠定了良好的基础。  相似文献   

13.
网页版面信息分析   总被引:1,自引:0,他引:1  
朱精南  赵明生 《计算机工程》2004,30(12):131-132,135
针对HTML网页版面中区域的形成及特点进行了分析,研究了网页版面中区域构成,相互关系等区域信息的分析和表示的方法,提出了一个便于描述网页版面信息的区域树结构,并举例说明了网页版面信息在网页信息处理中的应用。  相似文献   

14.
基于CSS类选择符重复引入的网页信息隐藏算法   总被引:1,自引:0,他引:1  
现有的网页信息隐藏算法存在信息隐藏点与网页内容分离、抗机器过滤能力较差的缺点.基于CSS类选择符重复引入策略,提出了一种新的网页信息隐藏算法.按照嵌入规则,采用重复引入可操作CSS块中相关对象的CSS类选择符的方法来嵌入信息.实验结果表明该算法信息隐藏点与网页内容紧密地结合,提高了抗检测和抵抗机器过滤的能力,且具有较好的隐蔽性,能够隐藏较大量的信息,可以应用于网页保护和隐秘通信.  相似文献   

15.
一种基于等价标记的网页信息隐藏算法   总被引:4,自引:0,他引:4  
针对现有网页信息隐藏技术存在的隐蔽性、抗机器过滤能力较差的缺点,改进了基于属性对顺序的网页信息隐藏技术隐藏信息量较少的缺陷,提出了一种基于等价标记的网页信息隐藏算法.该算法将待隐藏的秘密信息M转变为一个大整数N,按照嵌入规则,采用等价标记置换原标记的方法将大整数N隐藏在网页中.实验结果和分析表明,该算法没有增加网页文件的长度,能够隐藏较大的秘密信息,且具有较高的隐蔽性和安全性,可以应用于网页内容保护和隐秘通信.  相似文献   

16.
许多人上网打开网页的过程中,喜欢收集一些自己感兴趣的文字内容,如果采取收藏网页的方式进行存储,查找起来非常不方便。提出了通过利用VFP编程实现在网页上自动收集文本内容。  相似文献   

17.
1 前言随着互联网建设的不断发展,网站和网页数目都已经很难用Lawrence在Science和Nature给出的结论来估算。每个在网上冲浪的人都有体会,迷失在Internet浩瀚的资料中是多么容易。世界上最大的搜索引擎Google已经宣称搜索并索引了2,073,418,204张网页,在这近21亿索引并分类的网页中搜索,用户同样会迷失在层层链接之中。  相似文献   

18.
网络日益成为大众获得信息和生活交流的一种重要方式,网页设计也成为各种媒体关注的技术,文章通过对网站首页的分析,从网页设计这个行业的历史、现代、未来三方面之间的密切联系和逐步发展进行了阐述,也提及了网页设计软件、语言的变化,及所包含的内容和设计所要遵循的原则。提出了网页设计发展的观点和对未来网页的设想。  相似文献   

19.
The effect of internet advertising has been a controversial issue, especially on the topic of how to effectively draw more attention from internet users. According to traditional attention theory, we know people pay lesser attention on other objects if the main browsing contents occupy more of the viewer’s mental resources. Therefore, we know different information types of webpage should have different influences on users’ attention. On the other hand, an effect called ‘banner blindness’ makes viewers naturally overlook the advertising based on their previous experience. It is therefore becoming more and more difficult to increase viewer’s attention on advertisement simply by adding salient features on the advertisements. In light of this new challenge in Internet advertising, verifying the different influences of the information types on advertising attention is the main goal of this study.Great amounts of previous studies relevant to internet advertising focused on the advertisement itself, like the form, color, size and location. However, this study put focus on how the information types and the webpage structure influence the viewer’s attention on banner advertising. This research tested the effect on user attention of four common information types on Internet webpages: (1) text-based webpage; (2) text-picture mixed webpage; (3) picture-based webpage; and (4) video-based webpage. This study hopes to provide valuable information for matching advertising with viewing tasks that will stimulate the most user attention.  相似文献   

20.
网络日益成为大众获得信息和生活交流的一种重要方式,网页设计也成为各种媒体关注的技术,文章通过对网站首页的分析,从网页设计这个行业的历史、现代、未来三方面之间的密切联系和逐步发展进行了阐述,也提及了网页设计软件、语言的变化,及所包含的内容和设计所要遵循的原则。提出了网页设计发展的观点和对未来网页的设想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号