首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   6篇
  国内免费   1篇
  完全免费   1篇
  自动化技术   8篇
  2006年   1篇
  2005年   1篇
  2004年   3篇
  2003年   1篇
  2002年   2篇
排序方式: 共有8条查询结果,搜索用时 15 毫秒
1
1.
数据仓库中ETL技术的研究   总被引:42,自引:0,他引:42  
作为数据仓库的关键部件,支持数据抽取,清洗,转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素,该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。  相似文献
2.
使用KNN算法的文本分类   总被引:29,自引:2,他引:27  
张宁  贾自艳  史忠植 《计算机工程》2005,31(8):171-172,185
介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。  相似文献
3.
一种基于动态进化模型的事件探测和追踪算法   总被引:17,自引:2,他引:15  
在大量分析网络新闻特点的基础上,借鉴Single-Pass聚类思想,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法.该动态模型是基于新闻事件的生存特点提出的,包括:基于时间距离的相似度计算模型、事件模板进化策略以及动态阈值设置思想.该算法可以自动对新闻资料进行组织生成新闻专题,进而为用户提供个性化服务.实验结果验证了算法的有效性.  相似文献
4.
一种基于Rough集的层次聚类算法   总被引:13,自引:0,他引:13  
Rough集理论是一种新型的处理含糊和不确定性知识的数学工具,将Rough集理论应用于知识发现中的聚类分析,给出了局部不可区分关系、个体之间的局部不可区分度和总不可区分度、类之间的不可区分度、聚类结果的综合近似精度等定义,在此基础上提出了一种基于Rough集的层次聚类算法,该算法能够自动调整参数,以寻求更优的聚类结果。验结果验证了该算法的可行性,特别是在符号属性聚类方面有较好的聚类性能。  相似文献
5.
基于概率统计技术和规则方法的新词发现   总被引:9,自引:1,他引:8  
贾自艳  史忠植 《计算机工程》2004,30(20):19-21,83
新词/短语的识别是自然语言处理、信息检索和机器翻译等领域的一项基础研究。该文分析了已有短语抽取技术,并结合汉语特点,提出了基于概率统计技术和规则方法相结合的概念抽取方法。该方法包括高效的“二元语法”统计模型、统计算法、统计选词策略、丰富的规则知识和规则过滤算法。实验证明该方法适用于从大规模语料库中自动高效地发现新词/短语。  相似文献
6.
多策略数据挖掘平台MSMiner的元数据管理   总被引:1,自引:0,他引:1  
元数据在数据仓库中扮演着非常重要的角色,对数据仓库的设计、开发、维护和管理具有非常重要的作用.在作者开发的多策略数据挖掘平台(MSMiner)中将元数据的使用范围从数据仓库拓展到包括ETL和数据挖掘任务等的整个系统,使之成为系统的核心和各个子系统之间联系的纽带.文中介绍了MSMiner的体系结构、元数据的主要内容、元数据管理实现的难点及采用的技术.  相似文献
7.
基于Web挖掘的网页清洗技术   总被引:1,自引:0,他引:1  
随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后根据实际观察提取规则并且用于模型统计的方法,去除噪音数据,抽取相关可利用的信息。  相似文献
8.
1.引言 Internet的迅猛的发展,使人们能方便快捷地获取众多的信息和服务。但是,面对Internet上浩瀚纷繁的信息海洋,人们常常会陷入窘迫的境地:一方面收到太多的信息无从选择和消化,淹没在繁杂的信息中;另一方面是信息的迷失,人们难于找到真正所需的信息。因此,信息社会对能够有效浓缩文本信息的网络自动文摘有着迫切的要求。自动文摘是自然语言理解的一个重要分支,而且文摘的研究也由来已久。早在50年代末,Luhn就首次设计了一个自动文摘系统,引起了世人的极大注目。从那时起,先后涌现了许多著名的系统。所谓自动文摘系统是指这样的一种软件系统,它能将给定原文的中心内容,或所需要的内容自动抽取出来,并用同于或不同于原文的句子表示出来。  相似文献
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号