首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近年来.数据挖掘技术已成为国内外研究热点.而数据分类是数据挖掘中最重要的任务之一。本文介绍了一种神经模糊数据分类方法NEFCLASS模型,它通过从数据学习得到模糊分类规则.产生具有良好解释性的分类结果,分析了它的结构、学习算法和修减策略.还讨论了它的实现工具和应用。  相似文献   

2.
本文简要介绍了高性能计算机,并描述了石油勘探基本原理和地震资料处理中叠前偏移等应用对高性能计算机在运算量和存储方面的需求,针对地震资料处理中的应用,讨论了高性能计算机几个关键技术的现状并对未来进行展望。实际情况表明,地震资料处理依赖于高性能计算机等信息技术,同时高性能计算机等信息技术也限制着许多地震资料处理新方法新技术的普遍应用。  相似文献   

3.
Data with missing values,or incomplete information,brings some challenges to the development of classification,as the incompleteness may significantly affect the performance of classifiers.In this paper,we handle missing values in both training and test sets with uncertainty and imprecision reasoning by proposing a new belief combination of classifier(BCC)method based on the evidence theory.The proposed BCC method aims to improve the classification performance of incomplete data by characterizing the uncertainty and imprecision brought by incompleteness.In BCC,different attributes are regarded as independent sources,and the collection of each attribute is considered as a subset.Then,multiple classifiers are trained with each subset independently and allow each observed attribute to provide a sub-classification result for the query pattern.Finally,these sub-classification results with different weights(discounting factors)are used to provide supplementary information to jointly determine the final classes of query patterns.The weights consist of two aspects:global and local.The global weight calculated by an optimization function is employed to represent the reliability of each classifier,and the local weight obtained by mining attribute distribution characteristics is used to quantify the importance of observed attributes to the pattern classification.Abundant comparative experiments including seven methods on twelve datasets are executed,demonstrating the out-performance of BCC over all baseline methods in terms of accuracy,precision,recall,F1 measure,with pertinent computational costs.  相似文献   

4.
一种高效体数据压缩算法及其在地震数据处理中的应用   总被引:2,自引:0,他引:2  
采用可编程图形硬件对大规模体数据进行直接体绘制时常常受到图形卡容量的限制,导致数据在内存与显存之间频繁交换,从而成为绘制的瓶颈.为此,提出一种大规模体数据矢量量化压缩算法.首先对体数据分块,并依据块内数据平均梯度值是否为0对该块进行分类;然后用3层结构表示梯度值非0的块,对其中次高层和最高层采用基于主分量分析分裂法产生初始码书,用LBG算法进行码书优化和量化,而对最低层以及梯度值为0的块采用定比特量化.实验结果表明,在保证较好图像重构质量的前提下,该算法可获得50倍以上的压缩比和更快的解压速度.  相似文献   

5.
不平衡数据分类是机器学习研究领域中的一个热点问题。针对传统分类算法处理不平衡数据的少数类识别率过低问题,文章提出了一种基于聚类的改进AdaBoost分类算法。算法首先进行基于聚类的欠采样,在多数类样本上进行K均值聚类,之后提取聚类质心,与少数类样本数目一致的聚类质心和所有少数类样本组成新的平衡训练集。为了避免少数类样本数量过少而使训练集过小导致分类精度下降,采用少数过采样技术过采样结合聚类欠采样。然后,借鉴代价敏感学习思想,对AdaBoost算法的基分类器分类误差函数进行改进,赋予不同类别样本非对称错分损失。实验结果表明,算法使模型训练样本具有较高的代表性,在保证总体分类性能的同时提高了少数类的分类精度。  相似文献   

6.
HPF(HighPerformanceFortran)是HPF论坛1993年推出的一种高性能数据并行语言。文章利用合作单位开发的p_HPF并行编译系统,在地震资料处理中得到了大规模的工业应用。基准测试程序和实际资料处理结果表明,基于HPF的地震资料并行处理具有可编程性强、可移植性好和并行效率高等特点,具有很好的应用前景。  相似文献   

7.
近邻法是模式识别非参数法中最重要的方法之一,重复剪辑近邻算法是近邻法的一种改进算法。在剪辑近邻法基础上重复执行剪辑运算,消除了样本集中的临界区的噪声样本,形成的决策面与贝叶斯决策面十分接近,因此用其设计的分类器是一种较理想的分离器。在一些样本类别较多和样本数据量较大的数据分类中有着广泛的应用。  相似文献   

8.
关联规则挖掘算法在分类中的应用研究   总被引:1,自引:0,他引:1  
提出了一个基于关联规则挖掘算法的医疗数据分类方法。介绍了关联规则的理论基础、关联规则挖掘算法及其在医疗数据挖掘中的应用方法,并利用介绍的算法对乳腺癌数据进行挖掘。获得了分类的实验结果,该模型系统达到了较高的分类准确率,证明了数据挖掘在辅助医疗诊断中有着广泛的应用前景。  相似文献   

9.
基于区间编码的XML索引结构的有效结构连接   总被引:22,自引:1,他引:22  
该文给出了一个XML树数据模型的形式化定义.将编码方案、逆序列表和路径索引的思想相结合,提出了一种改进的XML数据的索引结构;给出了两个实现双亲/孩子关系和拥有关系的结构连接算法,它们最多只需要对参与连接的两个列表分别进行一次扫描,并且能够根据双亲结构信息等利用Bt树索引尽可能多地跳过不需要参与连接的元素结点.实验结果表明,该文给出的基于XML索引结构实现双亲/孩子关系和拥有关系的结构连接算法是高效的、健壮的.  相似文献   

10.
范玉宏 《信息与控制》2005,34(6):733-736
受智能进化理论的启发,集成现有的免疫算法,加入更高的智能层次上新的免疫机制,建立了一个人工免疫系统的整体多层次架构.首先,从智能进化的角度说明基于整体免疫系统信息处理机制的算法具有更高的“计算”能力.然后,就一种新的基于人工免疫系统整体架构的数据分析算法,介绍了试验结果,并对结果进行了讨论.最后,笔者指出,人工免疫系统整体架构不仅可以提高现有算法的效率,而且可以扩展人工免疫系统的应用领域.  相似文献   

11.
本文主要针对目前安全事件管理系统中安全事件信息抽取的问题,提出了基于XML语言的安全事件信息和抽取方法描述的数据抽取框架DS_XML,该框架可以实现跨平台的,分布式的安全事件信息抽取,从而为安全事件管理系统提供可靠的安全事件信息数据源.  相似文献   

12.
本文主要针对目前安全事件管理系统中安全事件信息抽取的问题,提出了基于XML语言的安全事件信息和抽取方法描述的数据抽取框架DSXML,该框架可以实现跨平台的,分布式的安全事件信息抽取,从而为安全事件管理系统提供可靠的安全事件信息数据源。  相似文献   

13.
双相位码是数据串行通信和记录中使用的一种编码方法。在集散控制系统中使用的磁带机和飞行数据记录器中得到广泛应用。本文主要介绍双相位码的编码、译码原理及双相位码的特点;重点论述双相位码的编码和译码过程在微机上的实现。工程实践和实验表明,用微机实现双相位码的编码和译码过程是切实可行的。试用在TDC-2000集散控制系统中获得了圆满成功。  相似文献   

14.
计算机集群技术已经引起了石油地球物理界的广泛关注,如何将现有地震数据处理模块快速、高效地移植到集群上已成为地震数据处理需要解决的重大课题。本文将现有的基于消息传递(MPI)的并行地震处理模型与共享存储(OpenMP)模型相结合,实现了一个适合于SMP集群的并行地震数据支撑库,将涉及到消息传递的并行地震数据操作以直观的API的形式提供给开发人员。本文利用支撑库提供的API开发了一些测试模块。实验证明,支撑库可支持现有地震数据处理和显示模块的多种并行计算模型,并且能够获得较高的并行加速比和计算效率。  相似文献   

15.
本文分析采用格状编码调制和自适应均衡技术对HDTV传输系统性能的影响以及HDTV同播传输的干扰环境,给出克服干扰的措施。设计一种适合于HDTV应用的级连格状编码和RS码方案,并对其进行计算机模拟,模拟结果表明:该方案具有较好的误码性能。  相似文献   

16.
Several state-of-the-art techniques – a neural network, Bayesian neural network, support vector machine and naive Bayesian classifier – are experimentally evaluated in discriminating fluorescence   in situ hybridisation (FISH) signals. Highly-accurate classification of valid signals and artifacts of several cytogenetic probes (colours) is required for detecting abnormalities in FISH images. More than 3100 FISH signals are classified by each of the techniques into colour and as real or artifact with accuracies of around 98% and 88%, respectively. The results of the comparison also show a trade-off between simplicity represented by the naive Bayesian classifier, and high classification performance represented by the other techniques.  相似文献   

17.
“不完全拼音码”指在声、韵、调等方面有所省略的拼音输入码。输入法软件在处理不完全拼音码的时候,应该充分利用代码提供的信息,为用户检索出所有符合条件的汉字词语。文章指出并分析了微软最新版的MSPY2003和新注音输入法v6.5在处理声调缺省,韵母缺省以及音节歧义切分等问题时的一些欠妥之处,并根据语言学和辞书知识提出基于拼音码模板的解决策略。实验结果证明,这种方法是相当有效的。  相似文献   

18.
通过分析决策树ID3算法的基本原理,引出一种改进后的算法(IID3),并以CRM销售业绩相关数据的分类为例介绍数据分类的全过程.由对比可看到改进后算法的优势.  相似文献   

19.
不平衡数据集的特点导致了在分类时产生了诸多难题。对不平衡数据集的分类方法进行了分析与总结。在数据采样方法中从欠采样、过采样和混合采样三方面介绍不平衡数据集的分类方法;在欠采样方法中分为基于[K]近邻、Bagging和Boosting三种方法;在过采样方法中从合成少数过采样技术(Synthetic Minority Over-sampling Technology,SMOTE)、支持向量机(Support Vector Machine,SVM)两个角度来分析不平衡数据集的分类方法;对这两类采样方法的优缺点进行了比较,在相同数据集下比较算法的性能并进行分析与总结。从深度学习、极限学习机、代价敏感和特征选择四方面对不平衡数据集的分类方法进行了归纳。最后对下一步工作方向进行了展望。  相似文献   

20.
Condition-based fault diagnosis aims at identifying the root cause of a system malfunction from vast amount of condition-based monitoring information and knowledge. The needs of extracting knowledge from vast amount of information have spurred the interest in data mining, which can be categorized into two stages data preparation and knowledge extraction. It has been established that most of the current data mining approaches to fault diagnosis focus on the latter stage. In reality, condition-based monitoring data may, most of the time, contain incomplete, or missing data, which have an adverse effect on the knowledge or diagnostic rules extracted. Several approaches to deal with missing data can be found in literature. Unfortunately, all of which have serious drawbacks. In this paper, a novel approach to the treatment of incomplete data is proposed for the data preparation stage, while a rough set based approach has been developed to pre-process the data for the extraction of diagnostic rules. The two-stage data mining technique is implemented into a prototype system, RMINE, which also possesses a self-learning ability to cope with the changing condition-based data. A real industrial case study of a pump system is used to demonstrate the fault diagnosis process using RMINE. The result has shown the potential of RMINE as a general data mining prototype to condition-based fault diagnosis.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号