首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
胡晟 《软件》2012,(7):145-147
本文首先分析了Web挖掘的实际必要性,介绍了数据挖掘体系结构中的关键技术和运行原理。并且介绍了一般爬虫所实现的功能,在此之上给出了一种网络爬虫设计,重点论述了此爬虫的原理、实现、性能以及该爬虫的优点。最后,经实验证明,设计的爬虫能够高效地获取互联网上的各种信息资源。  相似文献   

2.
信息技术的快速发展为各行业领域注入了新鲜的活力,然而伴随而来的不良网络信息问题又成为网络文化安全面临的重要挑战.以Web信息搜索与数据挖掘为例,可考虑引网络爬虫,利用其进行信息资源的获取,对网络文化内容管理与监测能够发挥重要作用.本次研究将对网络爬虫原理做简单介绍,并结合Web信息搜索与数据挖掘实际,分析网络爬虫在其中的具体应用.  相似文献   

3.
王庆  王铮  汪定伟 《计算机工程》2008,34(11):197-199
在电子商务环境下,货源信息的质量将直接影响企业业务经营水平。该文对电子商务环境下的货源信息搜索问题进行分析,提出以万维网为信息源,采用Web挖掘和信息检索技术设计实现货源搜索机器人的方法。该机器人内置元搜索引擎,可以扩大搜索范围,通过对搜索信息进行分析处理,从中发现有价值的货源相关信息。  相似文献   

4.
数据挖掘在Web智能化中应用研究   总被引:3,自引:9,他引:3  
分析了Web信息的特点和目前开发利用的局限,提出在Web上采用数据挖掘技术即Web挖掘,促进web智能化的观点。全面阐述了Web挖掘在Web智能化中的几个重要应用。指出Web挖掘是Web技术中一个重要的研究领域,是发现蕴藏在web上知识、区分权威链接、理解用户访问模式和网页语义结构的关键,它使充分利用Web大量的真正有价值的信息成为可能,为智能化Web奠定了基础。  相似文献   

5.
顾客在Web上的行为留下的数据包含了对市场分析及预测非常有益的潜在信息.本文分析了在Web上应用数据挖掘技术分析此类信息的重要性,并给出了Web上数据挖掘技术的应用方案.  相似文献   

6.
随着电子商务的深入发展,互联网已成为电子商务的基础。电子商务环境下,如何从互联网中挖掘和利用数据是企业非常关心的问题。文章结合当前的电子商务环境,对重要信息的搜索问题进行了分析,提出了采用Web挖掘在互联网中搜索重要信息的方法,给出了该方法的一个实现技术。实验结果表明该方法可以在互联网中高效准确地搜索重要信息。  相似文献   

7.
Web搜索结果挖掘的研究与应用   总被引:3,自引:1,他引:3  
王霞  杨炳儒 《计算机工程与应用》2003,39(14):187-189,207
Internet上的信息是日益增加的,为了简单地获取所需要的信息和共享Internet上的信息资源,就必须要找到好的Web挖掘方法,其中基于加权统计的Web挖掘方法是一种简单的容易实现的方法。文章重点介绍了基于加权统计的Web挖掘方法和元搜索引擎,并实现智能搜索引擎,文章着重说明了基于加权统计的Web挖掘方法及算法中所使用的数据结构。  相似文献   

8.
Web数据挖掘分析   总被引:1,自引:0,他引:1  
国际互联网的广泛应用使得数据挖掘技术在Web数据挖掘得到了最大的发展,文章就Web数据挖掘技术的存储数据源、分类、实现技术作了详细的阐述,并介绍了一些实用的Web挖掘工具,对Web数据挖掘进行了探讨和分析,并指出了国内外的发展趋势和待解决的问题。  相似文献   

9.
宁彬  姜洪溪 《福建电脑》2007,(5):41-41,43
网络教学区别于传统教学模式的重要特征是向学生提供个性化的教学服务,而Web挖掘是实现个性化服务的关键技术。本文重点探讨了Web挖掘在网络教学中的应用,并构造了一个基于Web挖掘的个性化网络教学模型。  相似文献   

10.
Web搜索中的数据挖掘技术研究   总被引:4,自引:0,他引:4  
WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型。接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势。  相似文献   

11.
研究探索了包括目标理解、准备数据、数据预处理、建立模型、评估解释、知识应用等水文数据挖掘的六个过程。并采用公共的数据处理和挖掘算法,实现各过程之间数据无缝连接,形成了松散耦合的水文数据挖掘系统体系框架。在实施水文数据挖掘过程中,将数据挖掘的一些数据处理方式应用到了水文领域,同时也采用了水文领域中的一些数据处理技术,实现了数据挖掘领域与专业领域的数据处理和评价方式融合。通过选取江苏省国家水文数据库中的两个不同代表性区域的水文资料,严格按照水文数据挖掘的过程控制,以水文相似年查找为突破口,实施数据挖掘。在全方位地对结果分析、对比和评价后发现,以数据挖掘的方法,采用聚类分析中分层聚类的凝聚算法,进行水文相似年查找所发现的结果与水文领域专家知识基本相符。  相似文献   

12.
针对多信息源网站中化学物质信息的获取与数据库的更新查询问题,运用网络爬虫技术和包装器方法实现数据的抽取;采用自定义XML文件的方式,提出了任务分割、动态更新检查、失败重试机制方法,实现了动态信息源网站中化学物质信息的持续、实时抽取,并进行异常处理和监控。将抽取的数据运用正则表达式和排序算法进行预处理并构建全面而准确的化学品环境安全数据库,最终实现了对原有数据的更新查询,在一定程度上保证了可靠性、可用性、可扩展性、可维护性。  相似文献   

13.
数据挖掘在入侵检测系统中的应用研究   总被引:14,自引:4,他引:10  
数据挖掘技术在网络安全领域的应用已成为一个研究热点。入侵检测系统是网络安全的重要防护工具,近年来得到广泛的研究与应用,分析了现有入侵检测系统主要检测方法存在的问题,构建了应用数据挖掘技术的入侵检测系统模型以改善入侵检测的精确性和速度。对各种数据挖掘方法对入侵检测系统产生的作用做了描述。  相似文献   

14.
吴小竹  陈崇成 《计算机工程与设计》2007,28(15):3563-3565,3620
提出了一种新颖的数据挖掘系统的体系结构,该结构把SOA与传统的挖掘系统结构相结合.在此体系结构的基础上,实现了一个开放式挖掘系统,能够动态集成挖掘算法.将该系统应用于福州地热资源的数据挖掘中,结果证明通过将WebServices技术引入数据挖掘系统的构建中,能大大增强挖掘系统的功能.  相似文献   

15.
冯战申  吴亚桢 《计算机工程与设计》2005,26(9):2329-2331,2340
被称为下一代的网格体系结-OGSA,是建立在原有的"五层沙漏结构"的基础上,并结合最新的WebService技术提出的.OGSA的基本思想是以服务为中心.在阐述了其基本思想之后,通过一个智能搜索引擎的设计和实现,详细介绍了基于OGSA的服务设计流程,全面展示了OGSA的基本思想和工作机制.  相似文献   

16.
数据抽取及语义分析在Web数据挖掘中的应用   总被引:4,自引:1,他引:3  
袁占亭  张秋余  李威 《计算机工程与设计》2005,26(6):1425-1427,1437
把复杂的网络站点作为多个业务数据源,采用数据仓库及数据挖掘技术,从中抽取并净化数据到挖掘数据库,从而将数据抽取及语义分析应用于Web数据挖掘中。在此基础上又提出了运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,使数据提取更加准确。  相似文献   

17.
明德廷  李娟  尹怡欣 《计算机工程与设计》2007,28(9):1995-1997,2065
数据挖掘是从海量数据中发现有意义的模式和规则的一项关键技术.国内很少有商家使用数据挖掘来辅助商业决策.给出了基于Web Service的数据挖掘系统结构及实现方案;描述了一个基于Web Service的数据挖掘系统原型,进一步说明了所提出的系统结构具有较高的效率、可信度、可实施性和安全性.  相似文献   

18.
为了解决传统主题爬虫效率偏低的问题,传统主题爬虫会选择最有价值的链接进行访问,仅简单地计算链接的相关性,却忽视待分析URL之间的相关性关系,致使主题爬虫爬取效率较低。提出一种基于链接模型的相关性判别算法,综合利用有标种子URL和无标的待判别URL实现对无标URL的相关性判别,并推导出迭代初值选取对结果的不敏感性。实验结果表明,与传统的网络爬虫算法相关性判别方法相比,提出的方法效率更高。  相似文献   

19.
神经网络结构搜索(neural architecture search,NAS)是自动化机器学习的重要组成部分,已被广泛应用于多个领域,包括计算机视觉、语音识别等,能够针对特定数据、场景、任务寻找最优的深层神经网络结构.将NAS引入至脑数据分析领域,能够在图像分割、特征提取、辅助诊断等多个应用领域大幅度提升性能,展现低能耗自动化机器学习的优势.基于NAS进行脑数据分析是当前的研究热点之一,同时也具有一定挑战.目前,在此领域,国内外可供参考的综述性文献较少.对近年来国内外相关文献进行了细致地调研分析,从算法模型、研究任务、实验数据等不同方面对NAS在脑数据分析领域的研究现状进行了综述.同时,也对能够支撑NAS训练的脑数据集进行了系统性总结,并对NAS在脑数据分析中存在的挑战和未来的研究方向进行了分析和展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号