首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
互联网个人信息挖掘技术是指综合利用搜索引擎、博客、网络社交平台等一系列互联网公开资源挖掘某个人物的个人信息。通过从互联网上海量信息中提取线索,寻找关联,最终获取所需信息。本文设计了一种互联网个人信息挖掘模型并详细介绍了其工作原理与应用,利用该模型所提供的方法可以有效进行互联网个人信息挖掘。  相似文献   

2.
基于本体的法律信息语义检索   总被引:3,自引:0,他引:3  
网络中海量的法律信息及其多义性为准确、高效的查询检索提出了难题,进而也桎梏着司法判案、决策的方法。为了较好地解决司法信息检索中存在的问题,通过对国内外领域本体方法、语义Web技术的研究,借助本体的概念构建了面向案例的法律信息语义检索原型,为法律领域的知识管理和信息检索提供了可借鉴的参考。  相似文献   

3.
网络信息挖掘及其在搜索引擎方面的应用   总被引:1,自引:0,他引:1  
随着互联网信息的增长,网络信息挖掘已经成为数据挖掘领域研究热点之一.本文首先从网络信息挖掘的概念出发,介绍了它的分类及其在互联网的作用,重点介绍了其在搜索引擎的关键技术、实现步骤及应用.  相似文献   

4.
该文分析了信息检索技术产生的背景和它在网络海量信息资源中寻找所需的资源时给人们带来的好处,接着比较了三种典型信息检索模型的原理及各自的优缺点,给人们在如何选择合适的信息检索模型来开发自己的信息检索系统提供了很有价值的参考,最后分析了网络环境下信息检索的发展趋势。  相似文献   

5.
信息技术的飞速发展,为现代人们生活、工作、学习带来了一定的便利。目前,计算机科技与互联网技术正在逐渐扩展到更多领域,成为人们在各个领域中信息交流的重要途径,特别是在我国经济发展中发挥了重要的作用。信息技术在带给人们方便的同时,也产生了一定的网络安全问题。注重网络信息资源安全管理、排除网络信息中的安全隐患问题,是营造互联网环境中安全的首要任务。本文针对网络安全技术与网络信息资源管理进行研究。  相似文献   

6.
互联网的诞生使人类步入了信息社会,它极大地满足了人们对信息的需求和渴望,同时也为广大教师提供了海量的文化背景知识、教学材料和科研信息。但许多一线教师却因缺乏必要的信息检索能力,而无法充分、合理、高效地利用互联网这个巨大的信息资源库。面对信息化的挑战,教师应该如何充分利用互联网,不断更新自己的知识结构,提高教学效率,进而促进自身的专业发展,已成为关乎基础教育课程改革与教师队伍建设的关键问题之一。  相似文献   

7.
对等网信息检索的研究现状与展望   总被引:7,自引:0,他引:7  
随着对等网(P2P)研完的进一步深入以及P2P网络中Peer结点和共享文件的进一步增多,如何在非集中式的P2P网络中发现所需要的文件已经成为P2P从研究走向实用的关键所在。该文首先提出了P2P挖掘的概念,然后指出P2P信息检索作为P2P挖掘中的一部分,已经成为P2P研究的一个热点。接下来提出了P2P网络的路由、搜索、挖掘的框架模型,指明了该领域研究的框架。然后分层综述了P2P信息检索的进展状况,对各种检索方法做了深入分析。并指出了它们各自的优缺点和应用局限性,最后对今后的P2P信息检索领域的发展方向进行了展望。  相似文献   

8.
互联网技术的飞速发展使得数据的规模达到了空前的水平,人们从海量数据中获取有价值的信息变得越来越困难。主题模型是近年来计算机领域出现的一种新的概率模型,在自然语言处理、文本挖掘以及信息检索等领域都有很广泛的应用。基于主题模型的主题追踪技术和时态分析技术可以帮助人们从海量数据中快速找到感兴趣的内容,时态主题模型逐渐成为计算机科学领域的一个研究热点。首先,介绍主题模型以及时态主题模型的基本概念;然后,对各种时态主题模型进行分类,介绍了几种具有代表性的时态主题模型,分析比较了各种主题模型的优缺点;接着,分析了时态主题模型在社交媒体、学术文献和数据社区中的应用;最后,对时态主题模型未来的发展趋势进行了探讨。  相似文献   

9.
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。  相似文献   

10.
网络已经成为人们获取知识的一个重要途径。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎返回大量的无关信息.不能满足用户的特定信息检索需求。针对这个问题,Web信息检索领域出现了一个新的研究方向——主题驱动的Web资源发现。介绍了通用搜索引擎的基本结构、工作原理及现状。阐述了主题Web挖掘的研究背景、任务及目前研究技术的进展,并对其未来的发展方向进行了探讨。对通用搜索引擎和主题Web挖掘的关系进行了分析。  相似文献   

11.
毛曦  李琦  刘帅  朱亚杰 《计算机科学》2012,39(105):229-231,264
随着网络技术的不断发展,互联网已经成为一个海量、复杂多样的数据源,特别是随着Web2. 0与社交网络的兴起,每个网民都可视为一个空间传感器,其源源不断地将周围的空间信息发布在网上,互联网中的空间信息日益丰富。提出了面向网络的空间信息提取系统,在从Web页面中所包含的半结构文本或自由文本中识别出完整位置的基础上,提取出与该位置相关的专题属性信息,并将其结构化和空间化。通过系统实例的研究,验证了本系统的可行性。  相似文献   

12.
研究Web文档服务的准确性和快速性,网络信息抽取成为处理海量网络信息的重要手段,而大量异构信息的有效抽取是非常困难的,为了改进和提高系统对于海量异构网页信息的抽取查全率和查准率,提出了一种新的信息抽取的方法,算法利用了隐马尔可夫模型在处理规则知识上的优势对每个页面构建HTML树,并利用Shannon熵来定位数据域,再用Maxi-mum Likelihood方法实现隐马尔可夫模型的构建,实现对Web信息的抽取。仿真结果表明,通过对大量学术论文头部结构信息的抽取,应用算法可以使信息抽取在召回率和准确率方面有明显的提高。  相似文献   

13.
杨为民  李龙澍 《微机发展》2007,17(9):181-184
Web 2.0是相对Web 1.0的新的一类互联网应用的统称。基于Web 2.0模式,用户可以主动创造互联网信息,实现互联网的交互、互动、参与的目标。构建一个面向特定的主题的、基于Web 2.0的构件化信息服务平台。它能更好地服务于用户个体的微内容的收集、创建、发布、管理、分享、合作、维护等,对微内容进行表现、聚合、迁移,对社会性关系进行维护。  相似文献   

14.
基于Web挖掘的网页清洗技术   总被引:1,自引:0,他引:1  
随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后根据实际观察提取规则并且用于模型统计的方法,去除噪音数据,抽取相关可利用的信息。  相似文献   

15.
一种基于网络管理信息的安全系统设计与实现   总被引:1,自引:0,他引:1  
网络信息安全已成为互联网发展的最重要议题之一。网络信息服务不仅在数量上与日俱增,而且其传播方式也呈现出多样化。为方便有效地管制这些信息的传播,该文提出一个基于网络管理信息新思路实现的网络信息管制系统(NetCop),并详细描述了该系统及其主要模块的具体设计及实现方法。  相似文献   

16.
针对ERP实施风险评价信息获取的高困难性问题,利用网络存储的海量信息,在对ERP实施风险评价信息的分类基础上,构建基于网络的ERP风险评价信息挖掘模型,探讨模型中的关键技术,并给出一个典型用例。  相似文献   

17.
王立杰  李萌  蔡斯博  李戈  谢冰  杨芙清 《软件学报》2012,23(6):1335-1349
随着Web服务技术的不断成熟和发展,互联网上出现了大量的公共Web服务.在使用Web服务开发软件系统的过程中,其文本描述信息(例如简介和使用说明等)可以帮助服务消费者直观有效地识别和理解Web服务并加以利用.已有的研究工作大多关注于从Web服务的WSDL文件中获取此类信息进行Web服务的发现或检索,调研发现,互联网上大部分Web服务的WSDL文件中普遍缺少甚至没有此类信息.为此,提出一种基于网络信息搜索的从WSDL文件之外的信息源为Web服务扩充文本描述信息的方法.从互联网上收集包含目标Web服务特征标识的相关网页,基于从网页中抽取出的信息片段,利用信息检索技术计算信息片段与目标Web服务的相关度,并选取相关度较高的文本片段为Web服务扩充文本描述信息.基于互联网上的真实数据进行的实验,其结果表明,可为约51%的互联网上的Web服务获取到相关网页,并为这些Web服务中约88%扩充文本描述信息.收集到的Web服务及其文本描述信息数据均已公开发布.  相似文献   

18.
Web页面信息块的自动分割   总被引:8,自引:2,他引:8  
随着Internet的发展,Web页面数量的急剧增加,如何快速有效地获取信息变得越来越重要。一类Web页面往往包含着多个信息单元,它们在展现上排列紧凑、风格相似,在HTML语法上具有类似的模式,例如一个BBS页面上多个发言,每个信息被称为一个信息块。对于信息抽取、信息过滤等应用,需要首先将原始页面中分割为若干合适的信息块以便于后续的处理。本文提出了一种自动将Web页面分割为信息块的方法:首先通过创建Web页面结构化的HMTL分析树,然后根据包含有效文本量等确定包含信息块的子树,最后根据子树深度信息利用2-rank PAT算法进行分割。通过对BBS页面的信息块抽取实验,证明了该方法的有效性。  相似文献   

19.
基于内容的网页信息处理方法   总被引:2,自引:0,他引:2  
提出了一种基于内容的网页信息处理方法:利用顺序滤波直接对网页页面内容进行过滤处理,再根据设置的阈值将过滤后的网页页面变为黑白页面,从而提取出网页中的图像信息。对多个包含图像信息的网页进行处理的结果表明此方法能较有效的提取出网页中的图像信息。基于此方法和网页文本信息提取方法的不同原理,还尝试构建了一种基于内容的网页信息处理系统。  相似文献   

20.
针对村镇管理部门、企业和农户缺乏及时准确产业信息的问题,以提供村镇产业信息服务为目标,探讨Web信息抽取、网络地理信息系统WebGIS、富客户端技术在村镇产业服务信息系统建设中的应用。研究基于XML的产业市场信息Web抽取、基于富客户端的产业专题地图的动态制作和发布,在实际系统中成功运用,为村镇产业布局、产品市场交易提供有效的信息技术支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号