针对启发式特征选择策略忽略了特征间相关信息导致子最优的问题, 提出一种基于流形鉴别信息的特征选择(MDFS) 算法. 该算法根据近邻信息和标签信息刻画高维数据类内和类间流形结构, 以最小化流形散度差为准则构建目标函数, 并增加结构化稀疏正则项降低特征间冗余. 通过统一框架下的特征权重迭代优化获得最优特征子集. 在ORL 库、COIL20 库、Isolet1 库上的聚类实验表明, MDFS算法选取的特征子集相比传统算法具有更高的识别准确率和归一化互信息, 验证了所提出算法的有效性.
相似文献在类别不均衡的数据中, 类间和类内不均衡性问题都是导致分类性能下降的重要因素. 为了提高不均衡数据集下分类算法的性能, 提出一种基于概率分布估计的混合采样算法. 该算法依据数据概率分别对每个子类进行采样以保证类内的均衡性; 并扩大少数类的潜在决策域和减少多数类的冗余信息, 从而同时从全局和局部两个角度改善数据的平衡性. 实验结果表明, 该算法提高了传统分类算法在不均衡数据下的分类性能.
相似文献演化聚类算法(ECM) 是一种有效的在线聚类算法, 能够根据输入数据实时调整聚类. 但是, 该聚类算法依赖于预先设置的最大距离阈值, 而且对数据输入次序敏感. 针对这些问题, 提出一种基于自适应学习的演化算法(SALECM), 在无法获取数据先验知识的情况下, 无需人为预先定义参数, 可自适应地调整聚类. 实验结果表明, 与 ECM相比, SALECM可提高在线聚类的自适应性能, 也能在一定程度上缓解数据输入次序对算法的影响.
相似文献为了提高案例推理(CBR) 分类器的性能, 提出一种基于可信度阈值优化的CBR 评价分类方法. 首先, 通过一种可降低时间复杂度的改进型可信度评价策略对案例重用得到的建议解的可信度进行计算; 然后, 通过遗传算法(GA) 对可信度阈值进行迭代寻优; 接着, 根据得到的优化阈值将目标案例及其建议解划分为可信集或不可信集; 最后, 对不可信集按多数重用原则进行分类结论的调整, 从而实现可信的CBR 评价分类. 对比实验表明, 改进的可信度评价策略能有效提高分类性能, 从而可提高CBR分类器的决策与学习能力.
相似文献针对雷达组网量测数据不确定性大、信息不完备等特点, 基于决策树分类算法的思想, 创建类决策树的概念, 提出一种基于类决策树分类的特征层融合识别算法. 所给出的算法无需训练样本, 采用边构造边分类的方式, 选取信 息增益最大的属性作为分类属性对量测数据进行分类, 实现了对目标的识别. 该算法能够处理含有空缺值的量测数据, 充分利用量测数据的特征信息. 仿真实验结果表明, 类决策树分类算法是一种简单有效的特征层融合识别算法.
相似文献针对粗糙模糊聚类算法对初值敏感、易陷入局部最优和聚类性能依赖阈值选择等问题, 提出一种混合蛙跳与阴影集优化的粗糙模糊聚类算法(SFLA-SRFCM). 通过设置自适应调节因子, 以增加混合蛙跳算法的局部搜索能力; 利用类簇上、下近似集的模糊类内紧密度和模糊类间分离度构造新的适应度函数; 采用阴影集自适应获取类簇阈值. 实验结果表明, SFLA-SRFCM 算法是有效的, 并且具有更好的聚类精度和有效性指标.
相似文献提出一种基于属性分辨度的不完备决策表规则提取算法, 它是一种例化方向的方法. 首先从空集开始, 逐步 选择当前最重要的条件属性对对象集分类, 从广义决策值唯一的相容块提取确定规则, 从其他的相容块提取不确定 规则; 然后设计属性必要性判断步骤去除每条规则的冗余属性; 最后通过规则约简过程来简化所获得的规则, 增强规 则的泛化能力. 实验结果表明, 所提出的算法效率更高, 并且所获得的规则简洁有效.
相似文献提出一种面向演进数据流数据的分类方法, 在有效利用相邻演进窗内数据间相似性信息的基础上, 通过引入反例信息, 构建一种面向演进数据流的增强型演进分类器优化目标函数, 从而推导出面向演进数据流的分类方法.该方法在保有最大间隔原则和全局优化特性的同时, 充分考虑了反例信息对待解分类平面的影响. 在模拟和真实数据集上进行实验, 结果表明了所提出方法的有效性.
相似文献为了从多粒度、多层次的角度有效处理名义型属性和数值型属性并存的混合数据, 首先基于不同的属性集序列和不同的邻域半径构建双重粒化准则, 建立基于双重粒化准则的邻域多粒度粗糙集模型; 然后给出该模型的相关性质, 提出该模型下的属性约简算法, 约简结果可以根据实际问题的需要灵活选择合适的属性集和邻域半径. 实例分析验证了所提出模型和算法的有效性.
相似文献针对回归问题中存在的变量选择和网络结构设计问题, 提出一种基于互信息的极端学习机(ELM) 训练算法, 同时实现输入变量的选择和隐含层的结构优化. 该算法将互信息输入变量选择嵌入到ELM网络的学习过程之中, 以网络的学习性能作为衡量输入变量与输出变量相关与否的指标, 并以增量式的方法确定隐含层节点的规模.在Lorenz、Gas Furnace 和10 组标杆数据上的仿真结果表明了所提出算法的有效性. 该算法不仅可以简化网络结构, 还可以提高网络的泛化性能.
相似文献针对单一特征目标跟踪算法鲁棒性较差的问题, 提出一种基于特征可分性和稳定性度量的多特征融合目标跟踪算法. 在粒子滤波框架下, 通过计算不同特征对目标和背景的可区分性和稳定性, 设置重要性权值并自适应选择区分能力强、稳定性好的特征描述目标, 建立多特征融合目标模型. 在状态转移过程中, 给出一种基于特征稳定性度量的选择性模板更新策略, 并进行遮挡处理. 实验结果表明, 所提出的算法能够在复杂场景下鲁棒地跟踪目标.
相似文献布谷鸟搜索(CS) 算法是一种新型的生物启发式算法. 为了提高算法对不同优化问题的适应能力, 根据反馈控制原理提出一种基于种群特征反馈的布谷鸟搜索(SFFCS) 算法, 将年龄结构、变异成功率等种群特征作为反馈信息引入算法框架, 动态调节算法参数, 同时引入双进化策略机制和策略选择概率, 加强算法对局部搜索和全局搜索的平衡能力. 对标准测试函数和电力系统最优潮流问题进行数值实验, 实验结果表明, SFFCS 算法具有较好的收敛性能和适应能力, 验证了所提出算法的有效性和工程应用价值.
相似文献针对数据中存在的噪声对数据描述建模的影响, 提出一种基于快速聚类分析的支持向量数据描述算法. 该算法通过快速聚类分析算法对所要建模的数据进行预处理, 通过预处理快速剔除数据中存在的影响建模的噪声; 然后再将基于??NN算法计算获得的权重值加权在每一个数据上, 进行支持向量数据描述算法的建模. 在标准数据集上的实验分析表明, 所提出的支持向量数据描述算法较传统的支持向量数据描述算法和密度驱动支持向量数据描述算法在准确度上具有较明显的提升.
相似文献线性判别分析(LDA) 作为一种经典的特征提取方法被广泛地加以研究和运用, 然而LDA作为全局判别准则在一定程度上忽视了样本空间的局部结构和局部信息. 为此, 通过引入局部加权均值(LWM)并结合最大间距判别分析(MMC) 提出了具有一定局部学习能力的有监督的特征提取方法—–基于局部加权均值的最大间距判别分析(LBMMC). 算法结合了QR分解技术, 提高了其执行效率, 并通过在数据集上的测试结果表明了该算法的有效性.
相似文献