期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于Multi-Agent的Web文本挖掘系统 总被引：1，自引：0，他引：1

沈记全张行文《福建电脑》2005,(11):2-3

基于Multi-Agent(多智体)技术的Web文本挖掘是从海量信息源尤其是Web文本信息源中快速、有效地获取知识所提出的一个新型研究领域。本论文给出了基于Multi-Agent技术的Web文本挖掘系统模型,并利用Multi-Agent技术实现了Web数据预处理、数据的挖掘、知识的获取、知识的评价与表示等功能。相似文献

2.

Web文本表示及其分类研究

徐甜肖新峰《微计算机信息》2007,23(21):284-285,283

Web文本挖掘是Web数据挖掘的一个重要研究领域.文本挖掘的主要方法是文本分类和聚类.本文主要讨论了在文本挖掘中文本的表示,以及文本聚类的算法描述. 相似文献

3.

Web文本挖掘中的特征表示和特征提取

王圆孙铁利李杨《数字社区&智能家居》2006,(14)

该文介绍了Web文本挖掘的概念和一般处理过程,着重就Web文本挖掘中前期的分词、特征表示和特征提取的常用方法进行研究,同时对不同方法进行了初步比较。相似文献

4.

Web文本挖掘及特征选择 总被引：11，自引：0，他引：11

景丽萍黄厚宽《电脑与信息技术》2002,10(1):1-5,64

文章介绍了Web挖掘的有关理论，从Web文本挖掘的定义，Web文本挖掘任务的功能等方面加以阐述，然后重点分析了Web文本挖掘，文本的特征表示，特征选择，将多维文本分析与文本挖掘这两种技术有机地结合起来，快速，有效地挖掘Web上的HTML文档，最后，概述了Web文本挖掘的用途和前景。相似文献

5.

Web文本挖掘

肖湘萍高玉斌《数字社区&智能家居》2007,2(5):822-823

简要介绍Web挖掘的概念、分类及其功能,重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等。最后对Web文本挖掘的应用领域作了展望。相似文献

6.

Web内容挖掘技术研究 总被引：14，自引：4，他引：10

涂承胜鲁明羽陆玉昌《计算机应用研究》2003,20(11):5-9,15

简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。相似文献

7.

Web日志挖掘中路径补充的影响评

蔡卫欣冯振宇杨剑《计算机系统应用》2011,20(3):226-229

Web用户访问多是匿名访问,Web日志挖掘的主要目标是从Web访问记录中抽取用户行为模式,通过分析挖掘结果理解用户的行为,从而改进站点的结构.Web日志挖掘第一步是进行数据预处理.数据预处理是Web页面分析中最耗时的阶段,首先研究了数据预处理的过程,包括数据清洗、用户识别、会话识别、路径补充.提出了一种路径补充的算法,... 相似文献

8.

基于数据仓库的Web日志挖掘技术研究

席景科张辰谢红侠《计算机工程与设计》2007,28(24):5890-5892

Web日志挖掘是目前Web挖掘研究的一个重点.针对Web日志挖掘中存在的问题,给出了基于数据仓库技术的Web日志挖掘方案,就数据预处理、数据立方体设计及数据挖掘技术的应用进行了较为深入的探讨.并以一个Web站点日志为例,详细阐述了Web日志数据预处理、Web日志立方体设计以及数据挖掘算法的实现过程,并实现了一个Web日志多维数据集,能够有效解决Web日志分析中的难题. 相似文献

9.

一种基于新词发现的Web文本表示方法

吴春颖王士同蔡崇超《计算机应用》2008,28(3):764-767

Web文本表示是Web文本特征提取和分类的前提,最常用的文本表示是向量空间模型（VSM）,其中向量一般是基于词的特征项。由于向量空间模型本身没有考虑文本上下文间的潜在概念结构（如词汇间的共现关系）,而Web文本是一种半结构化文本,同时经常有新词出现,因此在VSM基础上提出了一种基于新词发现的Web文本表示方法：首先进行预处理将网页转化为文本;然后进行文本分词;接着通过二元互信息进行新词发现,同时把新词加入字典重新分词;最后用词和新词共同来表示Web文本。实验结果表明,该方法可以帮助识别未登录词并扩充现有字典,能够增强Web文本表示能力,改善Web文本的特征项质量,提高Web文本分类效果。相似文献

10.

基于用户访问树的Web日志挖掘数据预处理 总被引：1，自引：0，他引：1

刘加伶范军《计算机科学》2009,36(9):154-156

在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理. 相似文献