首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一种中文网页自动分类方法的实现及应用   总被引:6,自引:0,他引:6  
为了有效地组织和分析海量的Web信息,文章应用有指导的机器学习方法实现了一个中文网页分类器,并应用该分类器在“天网”搜索引擎上实现了大规模中文网页的目录导航服务。实验结果表明该分类器有较高的分类质量,满足了中文网页自动分类的要求。  相似文献   

2.
关于“中文网页自动分类竞赛”结果的分析   总被引:5,自引:1,他引:5  
在最近召开的“全国搜索引擎与网上信息挖掘学术研讨会”上,举办了一场“中文网页自动分类竞赛”,共有来自全国各地的10个队参加。本文在介绍本次竞赛活动规则和过程的基础上,详细分析了竞赛的结果,从而使我们对于目前中文网页自动分类技术的现状有了一种具体的认识:目前已有分类器的性能没有呈现出明显的差距,中文网页的分类比普通文本的分类要困难的多。同时,本文还尝试推出一个标准的中文网页分类的实例样本集,希望通过不断完善,最终作为中文网页分类技术研究的基本语料。  相似文献   

3.
文章分析了传统搜索引擎的缺点,提出了一种基于网页自动分类的分类查询搜索引擎新模型,重点阐述了利用粗糙集进行文本分类的方法,提出了一种基于特征矩阵的决策表约简算法,并以此实现了网页自动分类器。  相似文献   

4.
本文应用有指导机器学习方法实现了一个分类器.运用改进型的MI进行特征提取,并对传统的TFIDF加权公式进行了改进.实验结果表明该分类器有较高的分类质量,满足了中文网页自动分类的要求.  相似文献   

5.
一种提高中文搜索引擎检索质量的HTML解析方法   总被引:15,自引:1,他引:15  
中文搜索引擎经常会返回大量的无关项或者不含具体信息的间接项,产生这类问题的一个原因是网页中存在着大量与主题无关的文字。对使用关键字检索方法的搜索引擎来说,想在检索或者后处理阶段解决这类问题不仅要付出一定代价,而且在大多数情况下是不可能的。在这篇论文中,我们提出了网页噪声的概念,并针对中文网页的特点,实现了一种对网页自动分块并去噪的HTML解析方法,从而达到在预处理阶段消除潜在无关项和间接项的目的。实验结果表明,该方法能够在不占用查询时间的前提下100%地消除中文搜索引擎隐藏的间接项,以及大约11%的无法过滤或隐藏的无关项或间接项,从而大幅度提高检索结果的查准率。  相似文献   

6.
中文网页自动分类研究   总被引:2,自引:0,他引:2       下载免费PDF全文
本文以实践经验为基础,对网页的源程序公共结构进行了分析,并充分考虑到中文网页的文字特点,给出了一种中文网页的分类方法与实现手段,结果表明该方法行之有效。  相似文献   

7.
一种基于预分类的高效SVM中文网页分类器   总被引:4,自引:0,他引:4       下载免费PDF全文
中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等。提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现。实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高。  相似文献   

8.
为了提高搜索引擎的查准率,帮助用户快速地定位其感兴趣的网页,可应用中文网页自动分类技术,实现快速准确的搜索引擎系统,使其具有较高的查准率.  相似文献   

9.
一个基于Web挖掘的中文专业搜索引擎的设计与实现   总被引:3,自引:0,他引:3  
本文介绍了一个基于Web挖掘技术的中文专业搜索引擎的实现和所用的关键技术,提出了类别向量的概念以及如何将Web结构挖掘和内容挖掘结合起来,利用改进的VSM技术实 现网页自动分类的方法。  相似文献   

10.
误区1:网站目录就是搜索引擎 网站目录通常是经过人工分类的有系统的网站列表,通常附带有搜索功能。网站目录就是搜索引擎的名词始于雅虎,雅虎初创时就是只有一个网站目录,当然很快就通过外包的形式增加了网页级的搜索。中文网站提供目录搜索的远多于提供网页搜索的,加之媒体的各种炒作,许多网民误以为网站目录的搜索功能就是搜索引擎。  相似文献   

11.
Web智能研究现状与发展趋势   总被引:10,自引:0,他引:10  
Web智能是近年出现的一个崭新的研究方向,它是人工智能和高级信息技术在新的Web和Internet环境下相互融合的产物.首先从总体上讨论了Web智能的概念、研究内容和功能技术框架,然后分别就Web智能的几个核心方面的研究现状进行了综述,主要包括语义Web与ontology,Web Agent和Web挖掘等,并进一步给出了它们的研究重点和发展方向,最后是关于Web智能的研究展望和面临的挑战,指出智慧Web是Web智能研究的目标和中长期发展方向.  相似文献   

12.
介绍一种基于Web挖掘和URL相结合的Web过滤方法,利用Web挖掘实现基于内容的离线Web分类,有效地解决了单纯基于关键词过滤和人工维护URL过滤系统的缺陷。实验结果表明,该系统对于网页类别的识别达到了可以接受的程度,具有良好的实用价值。  相似文献   

13.
14.
一个网页在线发布系统的设计与实现   总被引:7,自引:1,他引:7  
论述了网站建设对网页发布系统的需求 ,并从系统设计思想、系统实现等方面详细介绍了一个网页在线自动发布系统的实现 ,该系统已在实际中得到了应用  相似文献   

15.
Web应用开发方法研究   总被引:3,自引:0,他引:3  
目前,Web系统开发缺乏严格和系统的方法,大多数应用开发和管理实践在很大程度上依赖于开发人员个人的知识和经验,造成的后果是所开发的Web系统大多是低质量的产品。而传统的软件工程方法不能适应Web设计的要求,为此人们研究提出了众多的Web开发方法。这些研究旨在提供全面支持Web应用开发生命周期的模型和方法,但由于这些方法本身存在的局限性及其它方面的原因,还没有得到广泛的应用。论文首先讨论了成熟的Web开发方法应该具有什么样的特性和功能,然后分析了现有Web开发方法各自的特点,最后总结了这些方法所存在的问题和今后的研究重点。  相似文献   

16.
Web个性化技术研究综述   总被引:1,自引:0,他引:1  
Web个性化是近年出现的一个重要研究方向,它是Web使用挖掘和信息技术在新的Web和Internet环境下相互融合的产物.首先讨论了Web使用挖掘及个性化的概念、研究内容和核心技术,然后对Web使用挖掘的关键技术进行了综述,包括数据采集与预处理、模式发现、语义Web与个性化等,并给出了它们的研究重点和发展方向,最后是个性化系统的研究展望和面临的挑战.  相似文献   

17.
在对目前Web存在的主要问题进行了分析的基础上,介绍语义网,并针对语义网优势和特征进行了论述,展望了语义网的发展前景。  相似文献   

18.
Web使用模式挖掘技术在网站营销中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
王玉珍 《计算机工程》2006,32(18):55-57
Web使用模式挖掘是Web数据挖掘的重要内容之一,其应用领域非常广泛。将Web数据挖掘技术应用于电子商务网站的营销中,可发现许多有用的信息,有效地使用这些信息可促进电子商务网站的发展。  相似文献   

19.
Web挖掘及其应用研究   总被引:7,自引:0,他引:7  
Web挖掘就是利用数据挖掘技术,从Web文档和Web活动中提取感兴趣的,潜在的有用模式和隐藏的信息,本文详细阐述了Web的特点,Web挖掘的分类及应用。  相似文献   

20.
ABSTRACT

A selective, annotated bibliography of books, journal articles, and electronic resources relating to Web site design aimed specifically at beginning library Web Managers.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号