排序方式: 共有112条查询结果,搜索用时 234 毫秒
61.
面向不平衡问题的集成特征选择 总被引:2,自引:1,他引:2
传统的特征选择方法基本上是以精度为优化目标,没有充分考虑数据样本类别分布倾斜性,在数据分布不平衡的数据集上性能表现不理想。在不平衡数据集上通过有放回的抽样方法独立地从数据集大类样本集中随机抽取多个样本子集,使每次随机抽取的样本数量与小类样本数量一致,然后将各抽取的样本子集分别与小类样本集组合成多个新的训练样本集。对多个新样本集的特征子集以集成学习的方式采用投票机制进行投票,数据集的最终特征子集以得票数目超过半数的特征共同组合而成。在UCI不平衡数据集上的实验结果显示,提出的方法表现出了较好的性能,是一种能够处理不平衡问题的有效特征选择方法。 相似文献
62.
徐雨明 《电脑编程技巧与维护》1999,(10):24-25
动态数据交换(DDE)是Windows所制定的程序间通讯协议,是应用程序间进行数据交换的一种方法,允许应用程序间共享数据,从而可为用户提供更为集中的运算环境。VFP系统是一个功能强大的关系型数据库管理系统,它对动态数据交换(DDE)的支持使得它能够作为DDE的服 相似文献
63.
数字图像插值算法的分析与实现 总被引:4,自引:0,他引:4
对常用的数字图像插值算法进行了深入的分析,指出双三次插值的本质是利用直接邻点的灰度值和(或)邻点间灰度值的变化率对待采样点进行内插,是常用插值算法中最好的算法,并在此基础上给出了Pascal语言的算法实现。 相似文献
64.
面向分类特征的无监督特征选择方法研究 总被引:1,自引:0,他引:1
针对分类特征数据给出一种新的特征重要性程度度量方法.以一趟聚类算法为基础,提出一种无监督特征选择方法.理论分析表明该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择.在UC I数据集上的实验结果表明,与文献中的经典方法相比,本文方法具有较好的性能,说明提出的特征选择方法是有效可行的. 相似文献
65.
66.
聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;(3)只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。 相似文献
67.
人名是反映用户国籍的关键信息,不同国籍的人名在结构和组成成分方面存在差异性和关联性.目前,基于人名的国籍识别研究工作大部分将人名切分成多个独立的字符单元,忽略字符间微妙的搭配和序列关系.针对上述问题,文中提出基于字符级截断式循环神经网络的人名国籍识别模型,将人名通过滑动窗口的方式截断成多个子序列,利用长短期记忆单元模型学习不同子序列内部的字符组合关系,通过平均池化操作聚合所有子序列信息,获取最终的人名向量表示.最后根据该人名向量实现用户的国籍识别.截断式的子序列有利于模型更关注人名内部的细微差异.在Olympic运动员和Aminer学者数据集上的实验表明,文中模型性能较优. 相似文献
68.
69.
随着闸机验票系统在很多门票收费场所的广泛应用,对闸机验票系统的可靠性、实时性、灵活性的要求也越来越高。本文介绍了一种离线与在线相结合闸机验票系统的设计与开发方法,较好地满足了上述的需求。 相似文献
70.