排序方式: 共有76条查询结果,搜索用时 15 毫秒
1.
Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子集合的链接指向关系设置权重,将待判定的网页进行度量。最后选取Anti-Trust Rank等算法作对比实验,结果验证了本文算法在准确率和适应性方面优于对比算法。 相似文献
2.
本地缓存和代理服务器环境下的网络日志挖掘 总被引:5,自引:0,他引:5
介绍了网络日志挖掘的基本概念,提出了一个网络日志挖掘通用系统的结构,分析了本地缓存和代理服务器对日志挖掘的影响,并给出了一种近似解决方案。这种方案通过网络拓扑结构和日志文件记录的结合,将杂乱无章的日志记录组合成具有语义信息的事务记录,从而使挖掘结果更有意义。 相似文献
3.
模糊聚合算子在医疗诊断中的应用 总被引:3,自引:0,他引:3
模糊性是客观世界的固有属性。该文用Dubois的平均聚合算子M和Yager的有序权平均算子OWA来改进Sanchez和Umeyama的诊断模型,使结果更稳定。 相似文献
4.
多Agent的自动协商 总被引:9,自引:1,他引:9
协商是多Agent系统实现协调、协作和冲突消解的关键环节。如何构造有效的协商模型来提高Agent的协商能力,是多Agent系统研究中待解决的问题之一。文章主要讨论了双边多项目协商问题,提出了相应的协商模型、协议和协商算法,具有一定的通用性。 相似文献
5.
6.
基于URL过滤与内容过滤的网络净化模型 总被引:2,自引:1,他引:2
在信息时代里,信息爆炸似地增长着,而为数众多的不良信息充斥其中。针对这种现状,许多的公司与研究机构都提出了自己的过滤模型。文中在研究过去模型的基础上,提出了一种高效可靠的网络净化模型。该模型在运用WCCP协议的前提下,结合了URL过滤和内容过滤这两种过滤方法对网络信息进行过滤,改进了传统的URL过滤算法。 相似文献
7.
网络在成为信息查询和发布平台的同时,海量的信息隐藏在查询受限的Web数据库中,使得人们无法有效地获取这些高质量的数据记录.传统的Deep Web搜索研究主要集中在通过关键字接口获取Web数据库内容.但是,由于Deep Web具有多属性和top-k的特点,基于关键字的方法具有固有的缺点,这就为Deep Web查询和检索带来了挑战.为了解决这个问题,提出了一种基于层次树的Deep Web数据获取方法,该方法可以无重复和完整地提取Web数据库中的数据记录.该方法首先把Web数据库模型化为一棵层次树,Deep Web数据获取问题就转化为树的遍历问题.其次,对树中的属性排序,缩小遍历空间;同时,利用基于属性值相关度的启发规则指导遍历过程提高遍历效率.最后,在本地模拟数据库和真实Web数据库上的大量实验证明,这种方法可以达到很好的覆盖度和较高的提取效率. 相似文献
8.
基于Iceberg概念格叠置半集成的全局闭频繁项集挖掘算法 总被引:2,自引:0,他引:2
研究专有的分布式数据挖掘算法是提高分布式数据库下数据分析和挖掘的有效方法.结合Iceberg概念格对于频繁项集精简表达的特性和其集成构造过程可并行化的特点,进而实现分布式全局闭频繁项集的挖掘.面对目前仍然缺乏有关Iceberg概念格分布式集成构造研究的文献,本文从理论上分析Iceberg概念格叠置集成构造全局Iceberg概念格的局限性,然后论证了基于Iceberg概念格叠置半集成构造全局Iceberg概念格的可行性,进而提出一个基于Iceberg概念格叠置半集成的频繁概念生长分布算法(Frecogd),并且把它应用于同构分布式环境下的全局闭频繁项集挖掘过程中.实验验证了该算法理论的可行性,同时也揭示了该算法的挖掘效能有待进一步的改进与提高. 相似文献
9.
基于覆盖关系的Deep Web数据源排名 总被引:1,自引:0,他引:1
Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检索的结果是抽样结果.通过选择合适的抽样方法,使抽样所反映出来的部分数据覆盖关系能够从一定程度上反映整个Deep Web的数据覆盖关系.进而通过对覆盖关系的估计,确定覆盖程度,并按其进行排名. 相似文献
10.