在类别不均衡的数据中, 类间和类内不均衡性问题都是导致分类性能下降的重要因素. 为了提高不均衡数据集下分类算法的性能, 提出一种基于概率分布估计的混合采样算法. 该算法依据数据概率分别对每个子类进行采样以保证类内的均衡性; 并扩大少数类的潜在决策域和减少多数类的冗余信息, 从而同时从全局和局部两个角度改善数据的平衡性. 实验结果表明, 该算法提高了传统分类算法在不均衡数据下的分类性能.
相似文献针对模糊规则分类中数据边界硬性划分的局限性问题,建立了云-神经网络模型,并提出了基于云-神经网络的模糊规则分类算法.在不影响数据模糊性和随机性的基础上,将数据转化为规则,并利用神经网络的学习能力,进行多属性模糊规则分类.与传统方法相比,该方法在保证数据模糊性和随机性的基础上,提高了模型精度和分类准确率.应用实例表明了该方法的有效性和可行性.
相似文献事务间频繁项集将传统的单维事务内关联规则扩展到多维跨事务关联规则,但事务间频繁项集的数量随滑动时间窗口的增大而迅速增加.利用频繁闭项集的特点,提出事务间频繁闭项集的概念及其挖掘算法(FCITA).该算法采用分割和条件数据库技术,避免生成庞大的扩展数据库;利用扩展二进制形式压缩事务,从而提高支持度的计算效率.此外,动态排序和哈希表极大地减少了频繁闭项集的测试次数.仿真比较表明,FCITA算法具有较高的挖掘效率.
相似文献引进模糊概念替代距离拒绝尺度,定义具有支持向量特性的模糊隶属度函数,以描述训练点隶属于聚类集的程度.惩罚了边缘点对聚类中心的贡献权重,从而抑制了聚类中心的偏移,在避免复杂的参数搜索过程的同时,保证了算法的鲁棒性能.仿真结果表明,在相同初始条件下,改进算法较原算法对不规则分布数据的处理效率更高.
相似文献提出一种高效的规则提取算法,采用熵测量改进Chi-merge特征区间离散化方法,模糊划分输入空间.先为每个数据生成单条规则,再聚集相同前项的单条规则产生带概率属性的分类规则.提取的规则无需任何调整,应用模糊推理便可获得较理想的分类效果,同时支持增量式规则更新.最后给出了新方法的性能测试结果.
相似文献针对雷达组网量测数据不确定性大、信息不完备等特点, 基于决策树分类算法的思想, 创建类决策树的概念, 提出一种基于类决策树分类的特征层融合识别算法. 所给出的算法无需训练样本, 采用边构造边分类的方式, 选取信 息增益最大的属性作为分类属性对量测数据进行分类, 实现了对目标的识别. 该算法能够处理含有空缺值的量测数据, 充分利用量测数据的特征信息. 仿真实验结果表明, 类决策树分类算法是一种简单有效的特征层融合识别算法.
相似文献在分析原有定义不足的基础上,提出一种新的动态关联规则,其支持度向量和置信度向量与经典定义相吻合,能更好地反映规则随时间变化的动态信息.进一步提出两种新的动态关联规则挖掘算法:ITS和EFP growth.其中:两阶段ITS算法具有较好的可理解性;基于扩展FP 树的EFP growth算法适宜于高密度海量数据的挖掘.实验
结果表明,该算法具有较好的挖掘性能和可扩展性,适用于动态关联规则的有效挖掘.
提出一种新的约简算法. 首先以全局等价类为最小计算粒度, 提出粗等价类概念, 深入研究其性质并证明粗等价类下求核和约简与原决策系统等价; 剖析3 类粗等价类与正区域间的内在关联, 设计针对1 和??1 两类粗等价类双边删减下正区域的渐增式等价计算方法, 从而设计双向剪枝策略以及多次Hash 的属性增量划分算法, 基于此给出高效完备的约简算法. 最后用UCI 中20 个决策集、海量、超高维3 类数据集从多个角度进行验证, 结果表明, 所提出的约简算法的完备性和高效性在绝大多数情况下优于现有算法, 尤其适用于海量数据和超高维数据集.
相似文献针对一个扫描周期内单个目标可能产生多个量测的问题, 提出一种基于标签随机有限集的扩展算法. 结合脉冲扩展标签多伯努利(-GLMB) 滤波器和多量测模型, 推导出新的更新方程; 采用假设分解策略对关联过程进行降维, 避免了量测分组过程. 实验分析表明: 所提出算法能对目标数进行无偏估计, 在低探测概率条件下跟踪性能明显优于多量测概率假设密度(MD-PHD) 算法; 计算开销在量测较少时高于MD-PHD, 量测个数增加时增幅低于MD-PHD.
相似文献针对复杂背景环境下的多目标跟踪问题,论述了主要的数据关联技术,将目标检测算法与粒子滤波相结合,利用颜色直方图作为观测模型,并利用全领域(GNN)算法进行数据关联,提出一种改进的基于粒子滤波的多目标跟踪算法,实现了视频场景中的多个目标跟踪.该算法对于目标在场景中的频繁出现和消失,相似外表,交叉运动和短暂遮挡等均有较好的处理效果.
相似文献针对流数据的实时、有序和维数高等特点, 提出一种基于多种群协同微粒群优化的流数据聚类算法. 该算法利用变量分而治之的思想, 多个种群协同优化多个类中心, 进而求出问题完整的类中心集合. 给出一种类中心变化趋势的预估策略, 以快速追踪环境变化. 为防止多个子微粒群同时优化一个类中心, 提出一种相似子微粒群的合并策略. 最后将所提出的算法用于多个数据集, 实验结果验证了算法的有效性.
相似文献演化聚类算法(ECM) 是一种有效的在线聚类算法, 能够根据输入数据实时调整聚类. 但是, 该聚类算法依赖于预先设置的最大距离阈值, 而且对数据输入次序敏感. 针对这些问题, 提出一种基于自适应学习的演化算法(SALECM), 在无法获取数据先验知识的情况下, 无需人为预先定义参数, 可自适应地调整聚类. 实验结果表明, 与 ECM相比, SALECM可提高在线聚类的自适应性能, 也能在一定程度上缓解数据输入次序对算法的影响.
相似文献由于组合导航系统具有强非线性和模型不确定性的特点, 工程中扩展卡尔曼滤波无法满足组合导航系统实际应用的要求. 为此, 针对贝叶斯框架下高斯类非线性滤波算法的估计性能给出具体分析. 首先, 在估计点处对非线性函数进行泰勒展开获得泰勒近似, 通过一阶矩和二阶矩分析滤波算法的近似精度; 然后, 通过数值稳定性对非线性滤波算法进行分析; 最后, 分别采用低维和高维模型对各滤波算法进行对比分析, 为组合导航系统的实践提供借鉴.
相似文献