排序方式: 共有71条查询结果,搜索用时 15 毫秒
1.
Spam网页主要通过链接作弊手段达到提高搜索排名而获利的目的,根据链接作弊的特征,引入链接相似度和作弊系数两个指标来判定网页作弊的可能性。借鉴BadRank算法思想,从Spam网页种子集合通过迭代计算链接相似度和作弊系数,并根据与种子集合的链接指向关系设置权重,将待判定的网页进行度量。最后选取Anti-Trust Rank等算法作对比实验,结果验证了本文算法在准确率和适应性方面优于对比算法。 相似文献
2.
本地缓存和代理服务器环境下的网络日志挖掘 总被引:5,自引:0,他引:5
介绍了网络日志挖掘的基本概念,提出了一个网络日志挖掘通用系统的结构,分析了本地缓存和代理服务器对日志挖掘的影响,并给出了一种近似解决方案。这种方案通过网络拓扑结构和日志文件记录的结合,将杂乱无章的日志记录组合成具有语义信息的事务记录,从而使挖掘结果更有意义。 相似文献
3.
基于URL过滤与内容过滤的网络净化模型 总被引:2,自引:1,他引:2
在信息时代里,信息爆炸似地增长着,而为数众多的不良信息充斥其中。针对这种现状,许多的公司与研究机构都提出了自己的过滤模型。文中在研究过去模型的基础上,提出了一种高效可靠的网络净化模型。该模型在运用WCCP协议的前提下,结合了URL过滤和内容过滤这两种过滤方法对网络信息进行过滤,改进了传统的URL过滤算法。 相似文献
4.
5.
基于覆盖关系的Deep Web数据源排名 总被引:1,自引:0,他引:1
Deep Web是隐藏在Web数据库中的结构数据,只能通过查询接口访问.目前大部分针对排名的研究都只停留在对Deep Web接口特征的分析上.利用抽样理论知识,将在Deep Web中进行的每一次检索行为看做是一次抽样,检索的结果是抽样结果.通过选择合适的抽样方法,使抽样所反映出来的部分数据覆盖关系能够从一定程度上反映整个Deep Web的数据覆盖关系.进而通过对覆盖关系的估计,确定覆盖程度,并按其进行排名. 相似文献
6.
多Agent的自动协商 总被引:9,自引:1,他引:9
协商是多Agent系统实现协调、协作和冲突消解的关键环节。如何构造有效的协商模型来提高Agent的协商能力,是多Agent系统研究中待解决的问题之一。文章主要讨论了双边多项目协商问题,提出了相应的协商模型、协议和协商算法,具有一定的通用性。 相似文献
7.
基于三层结构的XML数据库信息处理 总被引:3,自引:0,他引:3
论文阐述了XML的发展现状,目前在Internet技术发展中与关系型数据库的联系。然后描述了通过基于XML中间件的三层结构访问数据库信息的方法。最后给出了一个具体的实例,验证了这种信息处理方法的有效性。 相似文献
8.
9.
10.
目前机器翻译主要对印欧语系进行优化与评测,很少有对中文进行优化的,而且机器翻译领域效果最好的基于注意力机制的神经机器翻译模型-seq2seq模型也没有考虑到不同语言间语法的变换。提出一种优化的英汉翻译模型,使用不同的文本预处理和嵌入层参数初始化方法,并改进seq2seq模型结构,在编码器和解码器之间添加一层用于语法变化的转换层。通过预处理,能缩减翻译模型的参数规模和训练时间20%,且翻译性能提高0.4 BLEU。使用转换层的seq2seq模型在翻译性能上提升0.7~1.0 BLEU。实验表明,在规模大小不同的语料英汉翻译任务中,该模型与现有的基于注意力机制的seq2seq主流模型相比,训练时长一致,性能提高了1~2 BLEU。 相似文献