共查询到19条相似文献,搜索用时 375 毫秒
1.
摒弃了以往利用断点集来进行离散化的算法思想,利用分层聚类产生的概念树中的类标号对连续型属性进行离散化。本算法考虑不同连续属性离散化结果间的互补性和相关性,在不改变原信息系统不可分辨关系的条件下进行全局离散化,为连续属性的离散化方法提供了一个新的思路。实例分析表明,和其它离散化算法相比,本算法取得了较满意的结果。 相似文献
2.
3.
提出一种基于条件熵的粗糙集连续属性离散化方法,得出决策表在离散化后,保持其相容性的充分必要条件是基于条件属性的决策属性的条件熵为零,并在此基础上给出基于条件熵的粗糙集属性离散化步骤,最后进行实例分析,为解决粗糙集连续属性的离散化问题奠定一定的理论基础. 相似文献
4.
史运平 《机械工程与自动化》2008,(3):91-93
连续属性的离散化问题是机器学习、数据挖掘等领域中的重要研究课题之一.提出一种基于粗糙集理论的决策表离散化算法,该算法是一种基于决策表属性重要性的算法.首先给出粗糙集理论的几个基本概念,如决策表、不可分辨关系、信息熵和条件熵等,然后对离散化问题进行介绍,给出了基于决策表属性重要性的粗糙集连续属性离散化算法.该算法计算简单、易于实现,并以实例加以说明. 相似文献
5.
6.
7.
改进贪心算法的完善与应用 总被引:1,自引:0,他引:1
本文指出了基于布尔逻辑和粗糙集理论相结合的离散化算法的改进贪心算法存在的缺陷,提出了一种完善这一缺陷的方法,利用该方法可以得到一些连续量信息系统离散化时的最小断点集合,同时在断点集合中可以确定不变断点和可变断点以及可变断点发生的区域,还可以得到连续系统最小断点集合的个数,并通过例子进行了验证,达到了满意的效果. 相似文献
8.
《计算机集成制造系统》2017,(5)
为了使业务过程管理工作中的员工分配工作自动地进行、提高人员工作的效率,提出一种新算法。新算法考虑员工的认知特征,基于商业过程模型中的流程链接关系以及员工间的协作特性,研究员工协作认知特征的依赖度和冗余度属性,采用增量搜索策略自动分配员工。将新算法应用于制造企业相关数据集,结果表明,该算法能够在全体员工集合中寻找具备最大依赖度和最小冗余度特性的子员工集合、提高员工协作的效率。 相似文献
9.
《机械制造与自动化》2015,(5)
针对BP神经网络在实际工程应用中受到大量冗余信息的制约,以及基于信息熵的属性离散方法的阈值选取具有主观性的缺点,提出了改进的基于信息熵的粗糙集连续属性离散化算法。该算法将Naivescaler离散化算法和信息熵离散化方法相结合,减少了离散化算法中候选离散点的数量;基于粗糙集约简信息决策表,有效解决了BP神经网络训练样本过于庞大的问题;并通过改进的离散化算法对属性约简后数据进行分类,将分类后的数据运用到神经网络运算中,进一步缩短了神经网络的运算时间。通过实例分析表明,该方法具有很好的故障诊断效果,并有效提高了诊断效率。 相似文献
10.
决策树是数据挖掘分类方法中一个重要分支,广泛应用于各行业的客户关系管理系统中。介绍了决策树算法中的经典算法C4.5,该算法在对连续属性进行离散化处理时寻找最佳分割点比较耗时,结合Fayyad连续属性的最佳分割点总分布在边界点处的原理,对C4.5算法中的连续属性离散化过程进行了一些改进,改进的C4.5算法在构造决策树时与原C4.5算法相比具有相同的分类准确率和更高的计算速度。 相似文献
11.
12.
针对柴油发动机异常检测中的特征选择和分类器参数与检测精度之间的耦合关系,提出了一种基于非支配排序粒子群优化的柴油发动机异常检测封装式多目标同步优化方法.利用双树复小波包的分解与重构,对发动机振动信号进行时域、频域和时频域多角度特征提取,构建了较完备的特征参数集,分析了故障诊断中特征选择与分类器参数优化对检测精度的影响,运用非支配排序粒子群优化算法对多个优化目标进行协调和折衷处理,同时追求特征参数子集维数最小化和分类正确率最大化.实验数据分析表明,该方法能够寻找出最优的特征子集和分类器参数,提高柴油发动机异常检测的精度和效率. 相似文献
13.
14.
针对风电数据在采集与传输过程中会产生大量缺失值和异常值,采用DBSCAN算法和最优组内差分法(OIV)组合筛删异常值,随机森林(RF)算法填补缺失值,提升数据准确性;并建立基于以ConvLSTM为单元的编码-预测(EF)网络的风电多气象输入多步预测模型,为了更好利用气象特征信息,在ConvLSTM模型的输入侧添加具有自注意力机制的非局部(NL)模块增强数据特征表现,从而搭建组合数据清洗方法的NL-ConvLSTM多步风电功率预测模型。实验结果表明,该方法能够进一步提高风电功率多步预测精度和稳定性。 相似文献
15.
远距离行人小目标成像像素少、缺乏纹理信息,深度卷积神经网络难以提取小目标细粒度特征,难以准确识别与检测。本文提出一种远距离行人小目标检测方法。首先,在YOLOv4的基础上引入浅层特征改进特征金字塔,提取行人小目标细粒度特征,提出引力模型特征自适应融合方法,增加多层次语义信息之间的关联度,防止小目标特征信息流失。然后,采用增强型超分辨率生成对抗网络增加行人小目标特征数量,提高行人小目标检测准确率。最后,选取图像像素中占比范围为0.004%~0.026%的行人小目标建立试验数据集,通过与Faster RCNN、ION、YOLOv4对比实验验证。结果表明,本文方法mAP0.5提高了25.2%、26.3%、11.9%,FPS达到24,研究成果在远距离安防监测监控领域具有重要应用价值。 相似文献
16.
传统的基于历程的特征造型中,容易出现设计意图和设计结果前后不一致的问题,为此文中采取了基于完全双向语义约束的变量化特征造型,并提出用特征依赖图的数据模型来保存和维护设计中的各种特征信息及其之间的关系.它的形成是基于特征间的各种依赖关系,而不是基于特征创建的先后顺序,并且根据依赖关系完成特征实体和约束的添加、编辑、删除等操作.这种方法使得特征信息随时根据相关特征信息协调变化,特征语义能够始终保持一致,在现有的开发平台上和CAD系统中具有一定的可行性. 相似文献
17.
基于图像特征统计分析的PCB焊点检测方法 总被引:1,自引:0,他引:1
提出了一种基于图像特征统计分析的炉后焊点检测方法,以提高在线自动光学检测系统的检测性能和可操作性.提出双阈值的AdaBoost算法用于设计分类器,在训练的同时进行最优特征选择和分类器的增强,实现了焊点图像特征的自动提取和检测参数的自动设定.采用分类和回归树方法将焊点缺陷决策方法优化为一棵二叉决策树,提高了检测速度.实验结果表明,该方法训练速度较快,可以满足实际生产需要.与目前已经实用化的图像对比算法和图像分析算法相比,在保持现有检测速度基本不变的情况下,该方法的检测精度更高. 相似文献
18.
Niranjan Subrahmanya Yung C. Shin Peter H. Meckl 《Mechanical Systems and Signal Processing》2010,24(1):182-192
In applications like feature-level sensor fusion, the problem of selecting an optimal number of sensors can lead to reduced maintenance costs and the creation of compact online databases for future use. This problem of sensor selection can be reduced to the problem of selecting an optimal set of groups of features during model selection. This is a more complex problem than the problem of feature selection, which has been recognized as a key aspect of statistical model identification. This work proposes a new algorithm based on the use of a Bayesian framework for the purpose of selecting groups of features during regression and classification. The hierarchical Bayesian formulation introduces grouping for the parameters of a generalized linear model and the model hyper-parameters are estimated using an empirical Bayes procedure. A novel aspect of the algorithm is its ability to simultaneously perform feature selection within groups to reduce over-fitting of the data. Further, the parameters obtained from this algorithm can be used to obtain a rank order among the selected sensors. The performance of the algorithm is first tested on a synthetic regression example. Finally, it is applied to the problem of fault detection in diesel engines (30,000 data records from 43 sensors, 8 classes) and used to compare the misclassification rates with a varying number of sensors. 相似文献
19.
COOPERATIVE CLUSTERING BASED ON GRID AND DENSITY 总被引:2,自引:0,他引:2
HU Ruifei YIN Guofu TAN Ying CAI Peng School of Manufacturing Science Engineering Sichuan University Chengdu China 《机械工程学报(英文版)》2006,19(4):544-547
Based on the analysis of features of the grid-based clustering method-clustering in quest (CLIQUE) and density-based clustering method-density-based spatial clustering of applications with noise (DBSCAN), a new clustering algorithm named cooperative clustering based on grid and density (CLGRID) is presented. The new algorithm adopts an equivalent rule of regional inquiry and density unit identification. The central region of one class is calculated by the grid-based method and the margin region by a density-based method. By clustering in two phases and using only a small number of seed objects in representative units to expand the cluster, the frequency of region query can be decreased, and consequently the cost of time is reduced. The new algorithm retains positive features of both grid-based and density-based methods and avoids the difficulty of parameter searching. It can discover clusters of arbitrary shape with high efficiency and is not sensitive to noise. The application of CLGRID on test data sets demonstrates its validity and higher efficiency, which contrast with traditional DBSCAN with R* tree. 相似文献