首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
梁娟  陈智 《计算机时代》2011,(6):45-46,48
Web数据挖掘技术是近年来数据挖掘领域的研究重点之一。由于Web文档具有半结构化的特点,在执行具体的挖掘操作之前,对Web文档进行预处理是必不可少的。文章针对Web内容挖掘的预处理过程,提出一种以XML作为中介语言进行数据预处理的方法。  相似文献   

2.
以一个医院门诊和医保系统之间的整合互联为例,结合业务流程,详细阐述了如何运用WebSphere Studio Application Developer(WSAD)开发工具,系统地使用包括WebService、DADX技术以及XML相关工具实现跨部门系统间的整合和服务的交互。  相似文献   

3.
基于XML的Web内容挖掘逐渐成为Web数据挖掘的重要研究课题。论文定义了用户模型,通过三种途径建立用户模型,将XML和个性化技术应用到Web内容挖掘,设计了一个基于XML的个性化Web内容挖掘系统(PWCMS),并讨论了PWCMS的关键技术及实现。实践证明,将XML和个性化技术应用到Web内容挖掘是有效的。  相似文献   

4.
李环 《福建电脑》2008,24(4):37-38
Web数据挖掘是目前数据挖掘领域中一个很重要的研究领域,文章首先介绍了Web数据挖掘的几个分类,分析了Web数据挖掘所面临的问题,最后介绍了XML技术并对XML在Web数据挖掘的应用进行了研究。XML的推广和使用对于推动Web数据挖掘具有重要意义。  相似文献   

5.
基于XML的Web信息发布系统及其J2EE实现   总被引:7,自引:0,他引:7  
文中提出了应用XML技术来实现Web信息发布系统的实现方法,在分析现有Web信息发布系统的优缺点和XML技术用于实现Web信息发布的优点之后,给出了系统的模型,并结合具体的项目讨论了系统基于J2EE的实现技术。  相似文献   

6.
一种基于DOM的Web关键信息提取方法   总被引:1,自引:0,他引:1  
提出一种提取Web中的菜单和导航指示器等关键信息的方法,首先利用由W3C提出的文档对象模型技术提取出关键信息和与关键信息结构相似的其他信息,将得到的信息融合成信息列表,再利用熵原理从信息列表中识别出网站的真正关键信息。实验结果验证了方法的有效性。  相似文献   

7.
针对当前Web报表生成技术的一些局限性,提出了基于XML和XSLT(Extensible Stylesheet Language Transformations)的通用Web报表生成技术.对具体的系统架构和技术优势进行了阐述,并结合笔者所在单位自主研发的教务管理系统中的报表需求,给出了详细的设计和实现过程.  相似文献   

8.
运用XML这一成熟的技术,提出了一个基于Web的挖掘模型和抽取方法,并对该模型和数据抽取方法进行了分析与测试。  相似文献   

9.
文章提出一种基于DOM的Web信息提取方法,通过归纳学习获得被提取信息的定位路径,利用XPath和XSLT在数据定位和数据转换方面的特点编写提取模式,根据网页元素与DOM节点对应关系,判断所获得信息源是否适用于已有提取模式。  相似文献   

10.
为了有效地从Web页面上提取数据信息,本文建立一种基于XML的Web信息收集数据库。利用开源工具JTidy将Web页面加以整理,利用XML良好的结构特性,使用Dom4j工具包解析XML文件;按照XML中的标签层次特点作为对数据进行储存的依据;最后使用Hibernate将数据持久化地储存于数据库中,方便数据的储存与查询。  相似文献   

11.
在基于Web的管理信息系统的设计中,打印输出的设计实现是其中研究的一个热点问题.为此提出一种解决方案,通过使用XML、XSLT等技术,将内容与表现分离,实现Web方式下的打印输出,并以一个合同管理系统为例介绍了这一方案的具体实现.该方法为创建Web方式下的可打印文档提供了一个可行方案,对同类系统的设计研究具有一定的参考价值.  相似文献   

12.
Web日志的高效多能挖掘算法   总被引:76,自引:0,他引:76  
通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径,提出了一种新颖的Web日志挖掘算法。在该算法中,首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵、元素值为用户的访问次数,然后,在列向量进行相似性分析得到相似客户群体,对行向量进行相似性度量获得相关Web页面,对后者再进一步还可以发现频繁访问路径。实验结果表明了算法的有效性。  相似文献   

13.
一种开发ASP.NET服务器组件的改进方法   总被引:1,自引:0,他引:1  
本文提出一种开发ASP.NET服务器组件的改进方法。该方法是在创建过程中应用XML/XSLT技术,实现由外部的XML文件生成相应的ASP.NET服务器组件。这种方法提高了组件开发的效率和组件的可维护性与可扩展性。文中给出了应用改进方法开发ASP.NET服务器组件的实例。  相似文献   

14.
在信息检索领域,数据抽取技术已成为研究重点之一。提出一种基于DOM树的Web数据对象自动抽取方法。该方法首先将网页解析为DOM树,然后将结构相似的子树抽取出来作为候选数据对象,接着再计算候选数据对象的内容相似度,内容相似度低的则为数据对象。实验证明该方法能够有效地将各种Web数据对象从网页中抽取出来,召回率和准确率都比较高,且该方法独立于领域,独立于Web数据对象的表示形式,较好地解决了Web数据对象的抽取问题。  相似文献   

15.
基于本体的Web挖掘分类方法及应用   总被引:1,自引:0,他引:1  
为了解决Web挖掘系统中信息共享的语义问题,应用本体技术,在传统Web挖掘分类方法的基础上提出了一种基于本体的Web挖掘分类方法.实践表明,该方法能有效地解决传统Web挖掘系统中诸如"新项目"等问题,并为用户提供基于本体属性的更细粒度、交互式的语义Web信息服务.  相似文献   

16.
基于Web使用挖掘的思想,通过在Web日志文件中加入用户页面动作记录,结合浏览页面和页面行为两方面的内容,设计算法计算支持度计数,进行关联规则挖掘,力图提取更加准确的用户购买模式;参照这些模式,利用一种混合模式算法对Web站点匿名访问用户的购买概率进行预测,建立预测模型,并给出了实验结果分析.提出的模型对企业的客户关系管理具有积极的意义.  相似文献   

17.
一个基于Web Service的流通EDI系统的设计与实现   总被引:1,自引:0,他引:1  
本文描述了一个基于Web Service的流通XML/EDI系统的实现,该系统采用服务提供者、服务请求者、服务代理、最终用户端组成的四层结构,与传统的C/S结构相比具有跨平台、瘦客户和柔性结构等特点,中小型企业不需要进行特殊的配置即能通过Internet/Intranet完成电子交易。  相似文献   

18.
匿名用户的网络浏览特征挖掘   总被引:2,自引:1,他引:2  
在网络使用挖掘(web usage mining)中,分析用户的行为模式是一个关键的问题,尤其对于匿名用户特征挖掘更有实际意义,首先介绍如何从网络使用数据(web usage data)中提取出会话(session)信息,接着讨论会话的特征抽取和特征空间(feature space)的表达方式,并以此为基础提出了一种建立在会话特征信息上的戒名用户的网络浏览特征挖掘方法算法,这种算法在提高精确性的基础上减少了计算耗费,可以较好地解决路径的变长,方向性和动态聚集等问题。  相似文献   

19.
一种基于数据挖掘的Deep Web模式匹配方法   总被引:1,自引:0,他引:1  
模式匹配是Deep Web异构信息集成中的关键问题.介绍了一种整体性匹配方法,即同时发现大量模式,并一次性进行匹配.主要通过分析和比较两种已经存在的大规模模式匹配原型系统:MGS和DCM,结合它们核心算法的优点,提出一种新的基于数据挖掘技术的算法(Correlated-clustering).该算法先利用积极相关发现组匹配,再通过概念相似度的计算聚类同义属性,最后进行匹配选择.实验结果表明,本算法全面、效率高,充分体现了整体性方法的思想.  相似文献   

20.
提出了一提出了一个基于CORBA的分布式Web挖掘系—DWMBC,它采用基于Web的管理模式,利用CORBA进行分布式处理。将分布式信息处理和Web挖掘有效地结合起来,具有跨平台、较好的安全性和可扩展性。另外,利用JAVA技术,它还能满足一些挖掘结果实时表示的要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号