首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在对现有主流网页消重技术分析的基础上,提出一种基于网页内容的改进的网页消重高效检测算法.该算法通过利用网页的标签树结构选取最大的多个文本块,将这些文本块连接在一起生成一个代表该网页的MD5指纹,对指纹进行比较,确认近似网页实现消重,实验证明该方法对近似网页能进行准确的检测.  相似文献   

2.
针对元搜索的重复网页问题,提出基于元搜索的网页去重算法,并通过实验对算法进行有效性验证。该算法首先对各成员搜索引擎返回来的结果网页的URL进行比较,然后对各结果网页的标题进行有关处理,提取出网页的主题信息,再对摘要进行分词,计算摘要的相似度,三者结合能很好的检测出重复网页,实现网页去重。该算法有效,并且比以往算法有明显的优势,更接近人工统计结果。  相似文献   

3.
为减少洪泛路由的盲目性,提出并验证了一种根据查询请求内容的不同来选择不同节点,进行查询转发的路由改进机制。节点保存描述已知节点资源的Bloom filter,按查询内容的匹配程度选择转发查询的邻居节点。实验表明,该机制可以减少消息冗余,提高路由效率,提高P2P系统的可扩展性。  相似文献   

4.
去重方案大多基于收敛加密,并依赖第三方服务器,存在安全问题和性能限制。为此,提出一种改进的去重技术。首先,采用双线性映射检测不同的加密数据是否来自同一明文内容,确保标签不会泄露任何明文信息;其次,运用Elgamal算法进行密钥传递,保证了密钥在传递过程中的安全性。实验结果表明,改进方案在密钥传递上仅需花费4 ms,且在标签生成方面具有更好的安全性和执行效率。  相似文献   

5.
将Bloom滤波器应用于路由表查找,可实现并行的最长前缀匹配.针对实际流量分布的临时集中性特点,引入了缓存机制以研究高性能的快速算法.分析结果显示,改进后的算法可以将Bloom滤波器的误检概率降低80%以上.  相似文献   

6.
基于N-Gram的文本去重方法研究   总被引:1,自引:0,他引:1  
中文文本去重是自然语言处理研究的一个重要方向。该文提出了一种基于N-Gram项和特征映射的文本去重方法。该方法提取N-Gram项的序列作为文本特征,将N-Gram项映射成哈希值,通过查找哈希值来判定文本是否重复。利用哈希数值查找代替字符串匹配,为实现快速的去重方法提供了一种新的可行的方法。实验表明,该算法对于普通网页文本去重能取得很好的效果。  相似文献   

7.
随着云存储时代的到来,越来越多的用户选择数据外包给云存储端进行存储和管理,云计算发展得到了质的飞跃。为了提高云存储效率和节约网络通信带宽,云环境下的数据加密安全去重问题成了研究热点。从机密性角度出发,对现有的数据加密安全去重算法进行比较分析和评价,并指出各安全去重算法的优势和存在的问题,最后给出基于内容加密的安全去重算法改进方案。该方案利用用户间文件级和用户内块级的不同安全策略解决传统去重算法存在的暴力破解攻击和时间开销较大等问题,并利用多级密钥来保证密钥安全性,同时减少密钥管理开销,以达到密钥管理开销和可靠性的平衡。  相似文献   

8.
针对IP路由查找中的最长前缀匹配问题,提出了一种基于Bloom滤波器的快速路由查找方法。首先,通过建立首字节索引表,减少了需要并行查询的Bloom滤波器的数量。其次,基于IP地址前缀长度分布的不均匀性对Bloom滤波器组的设置进行了优化,降低了查询过程对Bloom滤波器总数的需求。最后,将基本Bloom滤波器位向量中的每一比特位与一个计数器相关联,实现了对路由更新的支持。理论分析表明,与现有方法相比,利用该方法进行路由查找可以实现更低的选路表平均探测次数,并在最坏情况下具有更低的平均探测次数上界。实验结果验证了该方法的有效性及相关理论分析的正确性。  相似文献   

9.
目前,搜索引擎以整张网页作为最小处理单位进行排序处理,容易受到噪音信息的干扰.针对存在的问题,提出用网页分块对网页净化,进而利用净化结果改进传统的排序算法.首先,用基于视觉的网页分块算法VIPS将网页分成若干语义块,然后通过设定规则保留网页中与主题相关度高的语义块,最后用这些语义块代表整个网页参与检索,减少网页噪音对搜索引擎排序算法正确性的影响,实现了检索质量的改进.最后通过实验证明了改进算法的优越性.  相似文献   

10.
由于网络资源的复杂性,通用搜索引擎已经不能满足用户信息检索的准确性需要;为了满足并针对特定领域或特定主题查询的特定用户群的要求,专业搜索引擎技术成为目前信息检索领域内一个具有实用价值的研究热点。针对专业搜索引擎,在分析了网页评测的基本问题和方法的前提下,提出了一种基于H ITS“综合价值”评价的改进算法。  相似文献   

11.
Cyber-crimes are growing rapidly,so it is important to obtain the digital evidence on the web page.Usually,people can examine the browser history on the client side and data files on the server side,but both of them have shortcomings in real criminal investigation.To overcome the weakness,this paper designs a web page forensic scheme to snapshot the pages from web servers with the help of web spider.Also,it designs several steps to improve the trustworthiness of these pages.All the pages will be dumped in local database which can be presented as reliable evidence on the court.  相似文献   

12.
介绍了 CGI技术的工作原理 ,分析了基于 Linux的 Apache+ PHP+ My SQL模式的动态 Web页面的运行环境和实现过程 ,给出了用 PHP技术开发 CGI程序的应用实例 ,有效地解决了基于 B/S结构的信息查询问题  相似文献   

13.
阐述了在当前较为流行的B/S系统中,使用基于JSP技术的J2EE进行Web页面的组装技术.就如何将纷繁复杂的页面进行合理的组装,介绍了常用的页面组装技术.  相似文献   

14.
中文网页分类的研究与实现   总被引:6,自引:0,他引:6  
描述了一个完整的中文网页分类系统的设计和实现过程,重点介绍了网页分类中的网页净化、特征加权、KNN分类等关键技术.并结合网页的特征,对分类中的特征加权公式进行了一定的改进.实验结果表明改进后的特征加权公式取得了较高的分类准确率.  相似文献   

15.
在Web主页中添加动画和声音,可以增加主页的效果及趣味。本文介绍了一种高效、简单的动画制作工具——EGOR。  相似文献   

16.
网页设计的诸要素分析   总被引:7,自引:0,他引:7  
主要对网页设计中的造型、色彩、信息等各传播要素进行了分析 .根据造型中点、线、面各因素感情的表达 ,色彩的注目性、色彩心理的表达以及色彩的合理搭配 ,信息的功能表达与高效传达来说明一个好的网页设计所需的条件  相似文献   

17.
针对中文网页分类技术中的一些特征选择方法存在的问题.分析了常用的网页分类特征选择方法,提出了一种比较适合中文网页分类的特征选择方法.该方法将已有的X2统计方法进行了一些变形处理,并把该方法应用到后续的网页分类中,分类实验结果表明,准确率得到了一定的提高.  相似文献   

18.
浅谈网页导航栏设计的有效性   总被引:1,自引:0,他引:1  
互联网的使用早已经成为现代人类生活中必不可少的组成部分,其中网页更是承载着传递各类信息的重要使命,而导航栏则反映了网站内各种信息之间的关系,是直接影响信息传达效果的重要因素。本文针对目前网站设计中导航栏存在的一些问题,分析了影响导航栏设计的各种因素,并提出提高导航栏信息传递效率的一些基本方法。强调应以接受者的态度设计导航栏才能更接近用户、吸引用户,从而提高网站传递信息的效率。  相似文献   

19.
介绍了教学网页的构成要素,包括教学要素、导航要素、习题管理系统、电子邮件和电子公告板、教学环境等,提出了统一、连贯、分割、对比、和谐的网页设计原则,从信息设计因素和学习者因素对网页设计的认知因素进行了一系列探讨.  相似文献   

20.
视觉设计原理在网页设计中的运用   总被引:2,自引:0,他引:2  
强调了网页设计中灵活运用视觉设计原理的重要性,分析了“空间”和“色彩”是网页视觉设计的关键要素的原因,提出了网页视觉设计中的统一性问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号