首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 125 毫秒
1.
电子文档信息自动挖掘技术中的预处理研究   总被引:2,自引:0,他引:2  
基于Internet的信息挖掘是数据挖掘技术中的重要组成部分,也是网络信息处理领域中的一项新课题。本文介绍了Internet上的电子文档信息自动挖掘的概念和系统的体系结构,并给出了文档结构图解析、文档分类检索等电子文档自动挖掘的预处理过程及处理程序。  相似文献   

2.
文章主要研究电子文档信息自动挖掘系统的解决方案:采用I2DEF方法建立了系统模型;设计了双扫描缓冲区的无回溯搜索算法及搜索过程的双栈结构;描述了系统挖掘的处理过程及关键步骤的处理程序;最后给出了系统功能及实验结果。  相似文献   

3.
常浩  陈莉 《微计算机信息》2006,22(24):302-304
Internet是一个巨大的,分步广泛的,动态性强的全球信息服务中心,人们想在它上面找到想要的相关信息是很困难的,一般用户通过给搜索引擎提供简短的关键词来检索信息,但是通过搜索引擎返回的相关结果太多,这使得处理相关结果太耗时,本文提出了一种语义虚拟文档(SVD)来表示web文档,在此基础上实现了凝聚层次聚类算法,以自动聚类内容相似的web文档。结果:一方面使网络用户增强了相关结果的判断处理,同时使用户快速、高效的从Internet上发现想要的信息,另一方面返回的结果在知识表示上增强了web内容挖掘。  相似文献   

4.
通过在Internet上建立一个“展示”来为你的产品作广告、宣传你的生意、或出售信息和信息访问,你便可以在商业竞争中前进一大步。 World-Wide Web是你可以用来获得这类展示的几种Internet服务中最流行的一种。它的Hypertext Transfer Protocol(HTTP)和同时使用的Hypertext Markup Language(HTML)使你能够建立电子文档,这些文档可以依次利用其它Internet协  相似文献   

5.
研究并实现了一个面向领域的Web挖掘系统WMS,能有效地帮助用户挖掘Web上的信息和知识,用户可以通过提交Web页面、文本文档、URLs或关键词,向系统表达自己希望获得的信息主题,系统自动学习用户对特定领域的兴趣.并依据用户对系统采集文档的反馈评估,不断自适应地调整用户兴趣模型.WMS依据用户兴趣模型,利用智能Agents,对用户感兴趣的有关信息进行搜索和过滤,并对主要相关Web站点的信息更新进行监测,利用人工神经网络和智能Agents技术,WMS对所积累的文档库进行信息和知识挖掘,并自动将新信息推荐给用户.  相似文献   

6.
XML作为一种数据交换的标准,已经贯穿于Internet应用的各个领域之中。基于XML的文档对象模型(DOM)是一种与平台无关、语言无关的标准接口,是XML文档操作的基础。文中讨论了通过XML DOM为主要数据处理技术来进行自动排课系统设计中的一些关键技术及解决方法。  相似文献   

7.
随着Internet的发展,电子文档的数量成指数级增长,大量的文档之间存在密切的联系。将这些电子文档发布到WWW上需要有效地建立这些大量文档之间的链接,从而为用户提供一个更加友好的导航界面。对于以超文拳形式产生出来的大量文档,用手工的方式为其指定超链接,不但需要领域知识,而且将是一项极为繁重的劳动。因此,实现超文本建立的自动化是一项很有意义的工作。目前的各种超链建立方法存在着自动化程度不高和准确率低的缺点。本文基于关键词自动抽取提出了一种为文档自动建立超链接的方法。实验证明该方法取得了较好的效果。  相似文献   

8.
PDF文档是在Internet上进行电子文档发行和数字化信息传播的理想传媒形式。由于其具有平台无关、超强压缩和智能管理等优越性能,因此在印刷出版、商业和网络学习资源建设等方面得到了广泛的应用。该文以Adobe Acrobat 9 Pro为例,阐述了PDF文档的制作过程以及与其他文档的转换,最后在分析了电子文档市场现状的基础上指出了PDF文档的优势和未来的研究发展方向。  相似文献   

9.
PDF文档是在Internet上进行电子文档发行和数字化信息传播的理想传媒形式。由于其具有平台无关、超强压缩和智能管理等优越性能,因此在印刷出版、商业和网络学习资源建设等方面得到了广泛的应用。该文以Adobe Acrobat 9 Pro为例,阐述了PDF文档的制作过程以及与其他文档的转换,最后在分析了电子文档市场现状的基础上指出了PDF文档的优势和未来的研究发展方向。  相似文献   

10.
针对Web信息挖掘中的文本自动分类问题,提出了一种基于模糊向量空间模型和BP网络的分类方法。在进行文本分类特征提取时,根据特征词在文档中的位置信息和文档结构,构造出模糊分类特征向量,在此基础上,采用BP网络对Web文档进行分类,使分类方法更接近于手工分类。提高了文本分类的精度。文中以中国期刊网专题分类为例验证了方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号