首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
随着网络的高速发展,如何在海量信息中找到用户需求的高质量信息变得非常重要,技术难度较大.网页在搜索结果中排名是否靠前与巨大的商业利润相关联,这使得大量的垃圾网页出现在网络中.过滤Spam页面、给用户提供高质量的搜索结果成为当前Web搜索引擎的面临的一个巨大挑战.大量研究工作显示Spam页面之间存在着勾结的现象,分析Spam页面链接结构特性成为过滤Spam页面的重要方法.根据Spam网页链接结构存在的共性,提出了一种基于链接分析的Web Spam过滤方法.在标准检测数据集上进行实验,并与相关工作进行比较.实验结果表明,提出的方法能有效地对Spam网页进行过滤,提高搜索结果的质量.  相似文献   

2.
未登录词的识别是中文分词要面对的数个难题之一,解决好了这个问题就能够有力提升中文分词的效率.对此,文中简要介绍了专业搜索引擎的概况,并具体分析了对电影名进行中文分词的特点和介绍了传统的未登录词的识别策略,最后在此基础上提出了一种电影名未登录词的识别策略并简要分析了这种策略未来的优化方向.  相似文献   

3.
本文简要介绍了搜索引擎的原理,指出了大数据环境下搜索引擎用户数据信息存在的安全问题,并针对当今大数据发展趋势,提出了保障搜索引擎用户信息安全的建议。文章具有一定的参考价值。  相似文献   

4.
垃圾分拣的智能化和自动化对改善城市环境具有重要的意义,论文基于西安市2021垃圾分类数据集,提出了一种基于物体显著性检测和EfficientNet的垃圾分类算法。首先针对数据特点,采用U2-Net物体显著性检测模型获取物体语义显著区域,进而获取物体区域,去除复杂背景影响,然后结合数据增强及余弦调整策略,基于EfficientNet迁移学习构建垃圾分类模型。试验结果表明,该方法识别精度可达94.2%,可有效提升垃圾分类效率。  相似文献   

5.
随着信息技术的不断发展,个人办公数据日益增多,这些数据对单位和个人都是重要的财富.存储在个人电脑上的办公数据很容易因为存储的不可靠性以及人为误操作而造成丢失,带来不可挽回的损失.着重介绍了常用的4类备份存储设备,简要介绍了按照时间间隔、存放地点、备份内容分类的几种备份策略,并以备份存储为出发点,分析了备份策略的分类与选择备份的4种策略.  相似文献   

6.
李冬 《福建电脑》2012,28(2):133-134
随着互联网搜索引擎的广泛应用,Web Spam对人们产生的危害也日益严重,而Web Spam检测技术却总是无法跟上Web Spam产生的速度。本文提出一种基于网站访问日志分析的Web Spam检测方法,希望对此状况有所改善。  相似文献   

7.
智能型元搜索引擎的设计与实现   总被引:13,自引:0,他引:13  
刘丽  孙燕唐 《计算机工程》2003,29(6):118-120,133
研究现有元搜索引擎技术,提出了智能型元搜索引擎模型,即采用数据挖掘技术,根据独立型搜索引擎工作情况的记录,动态生成元搜索引擎的调度策略。在对各数据挖掘方法进行比较之后,选择了决策树归纳分类分析技术生成元搜索引擎调用策略,并详细介绍了调度策略的处理过程、系统评估度量的建立以及用微软最近发布的OLE DB for DM数据挖掘通用接口进行数据挖掘的具体实现。  相似文献   

8.
基于内容的搜索引擎垃圾网页检测   总被引:1,自引:0,他引:1  
有些网页为了增加访问量,通过欺骗搜索引擎,提高在搜索引擎的搜索结果中的排名,这些网页被称为"搜索引擎垃圾网页"或"垃圾网页"。将搜索引擎垃圾网页的检测看成一个分类问题,采用C4.5分类算法建立决策树分类模型,将网页分成正常网页和垃圾网页两类。实验表明我们的分类模型可以有效地检测搜索引擎垃圾网页。  相似文献   

9.
《微型机与应用》2021,(1):50-55
垃圾图片分类算法对于垃圾分拣的智能化和自动化具有重要的意义,针对我国垃圾分类现状,收集制作了小型生活垃圾数据集,提出基于残差结构和幻象模块的垃圾图片分类算法。使用幻象模块代替ResNet18的普通卷积,在不降低网络性能的同时减少了网络的参数量。采用数据增强方法扩充训练数据,防止过拟合。实验结果表明,改进后网络的参数量减少了46%,识别精度提高了1%。  相似文献   

10.
近年来.数据挖掘技术已成为国内外研究热点.而数据分类是数据挖掘中最重要的任务之一。本文介绍了一种神经模糊数据分类方法NEFCLASS模型,它通过从数据学习得到模糊分类规则.产生具有良好解释性的分类结果,分析了它的结构、学习算法和修减策略.还讨论了它的实现工具和应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号