共查询到19条相似文献,搜索用时 109 毫秒
1.
随着Internet的普及和相关技术的发展,Web上聚集了大量的信息资源。如何从这些Web信息资源中提取有用信息这一问题促使了Web文本挖掘技术的产生。本文首先介绍了粗糙集的相关概念和理论,然后对基于粗糙集的Web文本挖掘技术进行了初步探讨和研究。 相似文献
2.
3.
4.
5.
随着Internet的普及和相关技术的发展,Web上聚集了大量的信息资源.如何从这些Web信息资源中提取有用信息这一问题促使了Web文本挖掘技术的产生.本文首先介绍了粗糙集的相关概念和理论,然后对基于粗糙集的Web文本挖掘技术进行了初步探讨和研究. 相似文献
6.
描述了网络信息挖掘的含义以及与数据挖掘之间的区别,提出了在电子商务应用中采用网络信息挖掘帮助企业实现最大化利润的方法,最后指出了网络信息挖掘未来的研究方向。 相似文献
7.
描述了网络信息挖掘的含义以及与数据挖掘之间的区别.提出了在电子商务应用中采用网络信息挖掘帮助企业实现最大化利润的方法,最后指出了网络信息挖掘未来的研究方向。 相似文献
8.
首先对数据挖掘的发展现状作了简要的阐述,然后就数据挖掘在Web上的应用进行讨论,并着重于Web本挖掘技术的分析。同时,提出了一个在专业新闻信息获取系统的原型,以该系统原型为背景,利用Web信息搜索和Web本挖掘的相关技术实现在Web上获取信息的应用。 相似文献
9.
一种基于Web日志文件的信息挖掘方法 总被引:19,自引:1,他引:19
数据预处理和日志挖掘算法是Web日志挖掘中的关键技术。文中根据Web访问模式的用户特征,提出了一种基于Web日志文件的信息挖掘系统的体系结构。在此基础上,分析了其数据挖掘过程和信息挖掘算法。 相似文献
10.
随着Web上信息的快速增长,如何将潜藏于非结构化文档中的商业信息有效提取并分析服务于商业管理已成为新的研究热点。利用现有的Web信息挖掘技术,针对原始数据的混合异构性,提出信息块多主题分割的方法,在建立的商业领域实体名字典指导下对商业信息进行抽取和分类,并引入一种信用评级机制,构造了一个基于Web信息挖掘的商业信息分析系统(CABWIM),实验结果表明系统能有效地将散落在Web中游在的商业信息抽取并加工整理,形成真正有实用价值的商业信息。 相似文献
11.
随着信息技术的发展,web挖掘技术已成为数据挖掘技术的研究热点。本文针对Web挖掘中数据库环境的异构和信息半结构化等难题,提出了一个Webservices框架下的Web挖掘实现方案,使用XML关键技术对异构信息进行包装,使之成为统一的数据模式,从而可以采用数据挖掘技术从海量异构信息中提取出更加有用的信息。 相似文献
12.
基于信息过滤后的Web内容挖掘 总被引:4,自引:0,他引:4
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴含着具有潜在价值知识的分布式信息空间,为Web挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先论述了Web内容挖掘技术的挖掘原理和所面对的困难,然后介绍了信息过滤技术的规则以及过程。最后提出了基于信息过滤的Web内容挖掘的系统方案,较好地解决了当前Web内容挖掘中准确度不高、冗余性大的缺陷。 相似文献
13.
14.
15.
由于互联网上存在大量的信息资源,Web挖掘已成为数据挖掘的热点。本文介绍Web数据挖掘技术,比较HTML和XML的不同,充分利用XML的优越性,提出一种基于XML的数据挖掘模型,并详细论述该模型的特点及用途。 相似文献
16.
基于多层向量空间模型的Web信息检索方法 总被引:1,自引:0,他引:1
针对Web信息检索的特点,在分析传统向量空间模型存在问题的基础上,提出了一种多层向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段。按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。 相似文献
17.
通过Web统计信息挖掘研究股市反应 总被引:2,自引:1,他引:2
通过Web统计信息挖掘研究股市反应是网络金融课题,属于典型的计算机和金融的交叉学科。文中通过挖掘Web股市信息强度,发现当Web股市信息强度变化较小时,股价变动也常常较小,股市相对平静;当Web股市信息强度变化较大时,股价变动常常也较大,股市相对波动。文中提出了基于自适应标准差的Web股市信息强度变化挖掘方法,并使用股市数据进行了验证。该挖掘方法简单有效,有助于了解股市的微观结构。 相似文献
18.
本文介绍了一个Web维文信息检索系统,此系统根据用户设定的主题对指定的网站进行信息检索。该系统采用在西文信息检索中非常成功的向量空间模型来解决维文信息检索的问题,在维文文档的特征项抽取,加权、相似度计算,模型的建立等方面做了一些探讨,提出了一种针对解决基于网络的维文信息处理(如:维文网页下载,网页内容信息的存储,以及维文检索)的方法。文中论述了系统的设计思想和相关的算法以及实现技术。 相似文献
19.
随着知识管理第二阶段的到来,大多数企业中基于客户机/服务器或浏览器/服务器架构的知识管理系统的弊端日益突出。以指数级增长的网络信息资源及其访问量以及以同样速度递增的网络用户,极大地阻碍了人们有效地共享和管理各种网络资源。而现有的网络存储技术并不能有效地缓解存储压力。因此,论文提出了基于信息空间模型的网络信息资源存储网格方案来解决现有知识管理系统中存在的若干问题。在系统分析了导致现有知识管理系统存在相关弊端的根源并介绍了存储网络的相关研究后,详细介绍了信息空间模型,并在此基础上对各种网络信息资源进行了统一的、标准化的描述。然后给出了基于信息空间模型的网络信息资源存储网格的系统框架。在该环境下,统一组织和描述的各种网络信息资源分别存储在每一个分布式的网络终端,不仅有效解决了指数级增长的信息对存储容量的需求,而且能够有效消除“信息孤岛”现象,实现了负载均衡。而且,终端用户利用统一的语义映像能够实现对各种网络信息资源的共享与管理,极大地提高了资源的利用效率。基于信息空间模型的网格信息资源存储网格方案还极大地提高了系统的动态扩展性能。 相似文献