首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 375 毫秒
1.
叶斌 《机械与电子》2007,(12):13-15
摒弃了以往利用断点集来进行离散化的算法思想,利用分层聚类产生的概念树中的类标号对连续型属性进行离散化。本算法考虑不同连续属性离散化结果间的互补性和相关性,在不改变原信息系统不可分辨关系的条件下进行全局离散化,为连续属性的离散化方法提供了一个新的思路。实例分析表明,和其它离散化算法相比,本算法取得了较满意的结果。  相似文献   

2.
利用粗糙集理论从信息系统中知识获取与知识发现的功能,对转子轴承系统状态监测与故障诊断系统中知识库构造进行了研究。通过对粗糙集理论用于智能决策过程和诊断监测数据特性的分析,获得了数据表中连续属性值离散化映射、条件属性集与决策属性集记录的完备性是诊断知识获取与知识发现前提条件的结论。建立了基于粗糙集方法从数据库中知识获取和知识发现的诊断知识库模型,设置的连续属性值离散化步骤具有实现知识库决簏规则扩展的特点。  相似文献   

3.
提出一种基于条件熵的粗糙集连续属性离散化方法,得出决策表在离散化后,保持其相容性的充分必要条件是基于条件属性的决策属性的条件熵为零,并在此基础上给出基于条件熵的粗糙集属性离散化步骤,最后进行实例分析,为解决粗糙集连续属性的离散化问题奠定一定的理论基础.  相似文献   

4.
连续属性的离散化问题是机器学习、数据挖掘等领域中的重要研究课题之一.提出一种基于粗糙集理论的决策表离散化算法,该算法是一种基于决策表属性重要性的算法.首先给出粗糙集理论的几个基本概念,如决策表、不可分辨关系、信息熵和条件熵等,然后对离散化问题进行介绍,给出了基于决策表属性重要性的粗糙集连续属性离散化算法.该算法计算简单、易于实现,并以实例加以说明.  相似文献   

5.
杨阳  王越胜  陈强 《机电工程》2009,26(7):65-67,82
针对乳化炸药生产数据的特点,运用基于粗糙集理论的数据挖掘算法,通过改进的依赖度属性约简算法对决策系统进行了属性约简,根据决策表的属性依赖度提取比较决策规则,得到了乳化炸药生产优化方案。生产实践结果表明,优化方案有效地提高了乳化炸药轰爆性能,具有较高的经济价值。  相似文献   

6.
针对机械产品属性之间存在关联性问题,提出考虑属性组合关联的机械产品属性识别方法.将机械产品属性集看作粗糙集信息系统,考虑约简属性组合对条件属性的关联性,利用DEMATEL方法得出属性权重并结合正域依赖度计算约简属性组合重要度;考虑约简属性组合对决策属性的关联性,利用互信息理论计算约简属性组合的相关度.在此基础上,建立机...  相似文献   

7.
改进贪心算法的完善与应用   总被引:1,自引:0,他引:1  
高赟  侯媛彬 《仪器仪表学报》2004,25(Z1):727-729
本文指出了基于布尔逻辑和粗糙集理论相结合的离散化算法的改进贪心算法存在的缺陷,提出了一种完善这一缺陷的方法,利用该方法可以得到一些连续量信息系统离散化时的最小断点集合,同时在断点集合中可以确定不变断点和可变断点以及可变断点发生的区域,还可以得到连续系统最小断点集合的个数,并通过例子进行了验证,达到了满意的效果.  相似文献   

8.
为了使业务过程管理工作中的员工分配工作自动地进行、提高人员工作的效率,提出一种新算法。新算法考虑员工的认知特征,基于商业过程模型中的流程链接关系以及员工间的协作特性,研究员工协作认知特征的依赖度和冗余度属性,采用增量搜索策略自动分配员工。将新算法应用于制造企业相关数据集,结果表明,该算法能够在全体员工集合中寻找具备最大依赖度和最小冗余度特性的子员工集合、提高员工协作的效率。  相似文献   

9.
针对BP神经网络在实际工程应用中受到大量冗余信息的制约,以及基于信息熵的属性离散方法的阈值选取具有主观性的缺点,提出了改进的基于信息熵的粗糙集连续属性离散化算法。该算法将Naivescaler离散化算法和信息熵离散化方法相结合,减少了离散化算法中候选离散点的数量;基于粗糙集约简信息决策表,有效解决了BP神经网络训练样本过于庞大的问题;并通过改进的离散化算法对属性约简后数据进行分类,将分类后的数据运用到神经网络运算中,进一步缩短了神经网络的运算时间。通过实例分析表明,该方法具有很好的故障诊断效果,并有效提高了诊断效率。  相似文献   

10.
决策树是数据挖掘分类方法中一个重要分支,广泛应用于各行业的客户关系管理系统中。介绍了决策树算法中的经典算法C4.5,该算法在对连续属性进行离散化处理时寻找最佳分割点比较耗时,结合Fayyad连续属性的最佳分割点总分布在边界点处的原理,对C4.5算法中的连续属性离散化过程进行了一些改进,改进的C4.5算法在构造决策树时与原C4.5算法相比具有相同的分类准确率和更高的计算速度。  相似文献   

11.
采用变精度粗糙集理论挖掘系统状态信息与各单元性能参数的内在关系是解决复杂可修系统维修决策问题的一种客观量化方法。鉴于该类方法对连续型数据进行离散化处理过程中普遍存在的问题,本文提出了一种SOM网络离散化方法,采用该方法能够有效地解决断点设置的难题,并相应提高了该决策算法的精度。以CF6型航空发动机为例,应用该方法得到了用于判断发动机单元体维修等级、可信度较高的决策规则,从而为发动机工程师制订维修决策提供了重要的依据。  相似文献   

12.
针对柴油发动机异常检测中的特征选择和分类器参数与检测精度之间的耦合关系,提出了一种基于非支配排序粒子群优化的柴油发动机异常检测封装式多目标同步优化方法.利用双树复小波包的分解与重构,对发动机振动信号进行时域、频域和时频域多角度特征提取,构建了较完备的特征参数集,分析了故障诊断中特征选择与分类器参数优化对检测精度的影响,运用非支配排序粒子群优化算法对多个优化目标进行协调和折衷处理,同时追求特征参数子集维数最小化和分类正确率最大化.实验数据分析表明,该方法能够寻找出最优的特征子集和分类器参数,提高柴油发动机异常检测的精度和效率.  相似文献   

13.
胡建中  吴瑶  谢小欣 《中国机械工程》2013,24(24):3345-3348
针对传统的故障识别中未能充分利用特征信息的问题,提出一种基于局部线性嵌入(LLE)特征融合的故障识别方法,通过初步提取信号时域和时频域的特征获得原始特征集,利用LLE算法对原始特征集进行二次特征提取,进一步融合两组特征集并使用KNN算法进行故障识别。仿真信号数据分析与实际故障分析证明了所提方法对故障样本识别的可行性和有效性。  相似文献   

14.
针对风电数据在采集与传输过程中会产生大量缺失值和异常值,采用DBSCAN算法和最优组内差分法(OIV)组合筛删异常值,随机森林(RF)算法填补缺失值,提升数据准确性;并建立基于以ConvLSTM为单元的编码-预测(EF)网络的风电多气象输入多步预测模型,为了更好利用气象特征信息,在ConvLSTM模型的输入侧添加具有自注意力机制的非局部(NL)模块增强数据特征表现,从而搭建组合数据清洗方法的NL-ConvLSTM多步风电功率预测模型。实验结果表明,该方法能够进一步提高风电功率多步预测精度和稳定性。  相似文献   

15.
远距离行人小目标成像像素少、缺乏纹理信息,深度卷积神经网络难以提取小目标细粒度特征,难以准确识别与检测。本文提出一种远距离行人小目标检测方法。首先,在YOLOv4的基础上引入浅层特征改进特征金字塔,提取行人小目标细粒度特征,提出引力模型特征自适应融合方法,增加多层次语义信息之间的关联度,防止小目标特征信息流失。然后,采用增强型超分辨率生成对抗网络增加行人小目标特征数量,提高行人小目标检测准确率。最后,选取图像像素中占比范围为0.004%~0.026%的行人小目标建立试验数据集,通过与Faster RCNN、ION、YOLOv4对比实验验证。结果表明,本文方法mAP0.5提高了25.2%、26.3%、11.9%,FPS达到24,研究成果在远距离安防监测监控领域具有重要应用价值。  相似文献   

16.
传统的基于历程的特征造型中,容易出现设计意图和设计结果前后不一致的问题,为此文中采取了基于完全双向语义约束的变量化特征造型,并提出用特征依赖图的数据模型来保存和维护设计中的各种特征信息及其之间的关系.它的形成是基于特征间的各种依赖关系,而不是基于特征创建的先后顺序,并且根据依赖关系完成特征实体和约束的添加、编辑、删除等操作.这种方法使得特征信息随时根据相关特征信息协调变化,特征语义能够始终保持一致,在现有的开发平台上和CAD系统中具有一定的可行性.  相似文献   

17.
基于图像特征统计分析的PCB焊点检测方法   总被引:1,自引:0,他引:1  
提出了一种基于图像特征统计分析的炉后焊点检测方法,以提高在线自动光学检测系统的检测性能和可操作性.提出双阈值的AdaBoost算法用于设计分类器,在训练的同时进行最优特征选择和分类器的增强,实现了焊点图像特征的自动提取和检测参数的自动设定.采用分类和回归树方法将焊点缺陷决策方法优化为一棵二叉决策树,提高了检测速度.实验结果表明,该方法训练速度较快,可以满足实际生产需要.与目前已经实用化的图像对比算法和图像分析算法相比,在保持现有检测速度基本不变的情况下,该方法的检测精度更高.  相似文献   

18.
In applications like feature-level sensor fusion, the problem of selecting an optimal number of sensors can lead to reduced maintenance costs and the creation of compact online databases for future use. This problem of sensor selection can be reduced to the problem of selecting an optimal set of groups of features during model selection. This is a more complex problem than the problem of feature selection, which has been recognized as a key aspect of statistical model identification. This work proposes a new algorithm based on the use of a Bayesian framework for the purpose of selecting groups of features during regression and classification. The hierarchical Bayesian formulation introduces grouping for the parameters of a generalized linear model and the model hyper-parameters are estimated using an empirical Bayes procedure. A novel aspect of the algorithm is its ability to simultaneously perform feature selection within groups to reduce over-fitting of the data. Further, the parameters obtained from this algorithm can be used to obtain a rank order among the selected sensors. The performance of the algorithm is first tested on a synthetic regression example. Finally, it is applied to the problem of fault detection in diesel engines (30,000 data records from 43 sensors, 8 classes) and used to compare the misclassification rates with a varying number of sensors.  相似文献   

19.
COOPERATIVE CLUSTERING BASED ON GRID AND DENSITY   总被引:2,自引:0,他引:2  
Based on the analysis of features of the grid-based clustering method-clustering in quest (CLIQUE) and density-based clustering method-density-based spatial clustering of applications with noise (DBSCAN), a new clustering algorithm named cooperative clustering based on grid and density (CLGRID) is presented. The new algorithm adopts an equivalent rule of regional inquiry and density unit identification. The central region of one class is calculated by the grid-based method and the margin region by a density-based method. By clustering in two phases and using only a small number of seed objects in representative units to expand the cluster, the frequency of region query can be decreased, and consequently the cost of time is reduced. The new algorithm retains positive features of both grid-based and density-based methods and avoids the difficulty of parameter searching. It can discover clusters of arbitrary shape with high efficiency and is not sensitive to noise. The application of CLGRID on test data sets demonstrates its validity and higher efficiency, which contrast with traditional DBSCAN with R* tree.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号