排序方式: 共有58条查询结果,搜索用时 0 毫秒
1.
基于选择性集成的最大化软间隔算法 总被引:1,自引:0,他引:1
当前,boosting集成学习算法研究主要集中于最大化弱学习器凸组合的间隔或软间隔,该凸组合几乎使用了生成的所有弱学习器,然而这些弱学习器间存在大量的相关性和冗余,增加了训练和分类过程的时空复杂度.针对这一问题,在LPBoost基础上提出了一种选择性boosting集成学习算法,称为SelectedBoost.在每次迭代生成新的弱学习器以后,通过计算新生成的弱学习器与已有弱学习器的相关度和差异度,并结合当前集成的强学习器的准确率来判断是否选择该弱学习器.另外,当前的一系列boosting算法(如AdaBoost,LPBoost,ERLPBoost等),本质上是基于已生成的1个或者多个弱学习器来更新样本权重,但与弱学习器相比,强学习器更能代表当前的决策面.因此,SelectedBoost通过在带约束的间隔最大化问题中引入更加严格的强学习器边界约束条件,使得该算法不仅参考弱学习器边界,同时还参考已生成的强学习器来更新样本权重,进而提高算法的收敛速度.最后,与其他有代表性的集成学习算法进行实验比较,结果表明,该方法在收敛率、分类准确性以及泛化能力等方面均具有比较明显的优势. 相似文献
2.
傅彦 《电子科技大学学报(自然科学版)》1997,26(2):180-184
成功地提出了关于限制性手写体汉字的一种识别方法,并在486 DX/66 PC机上进行了模拟实验,取得了一定的效果。对于经预处理后的手写体汉字,采用结构识别法、统计决策法和模糊数学法相结合的一种方法。另外,提出了对相似文字的识别方法。 相似文献
3.
以计算机数据库为依托,充分利用多种通信业务资料,建立起一种综合评估固定通信台站值勤维护质量的数学模型-模糊综合评估模型。应用该模型可以更全面客观地对台站值勤维护进行综合评估,完成对台站值勤维护业务的评定、排队、优选,并以此提出对台站工作质量的反馈评价意见,为各级通信管理者提供科学的决策依据。 相似文献
4.
近年来,随着复杂网络演化模型的深入研究,研究的焦点已从全局结构转移到了局部结构,其中,网络的集团度及其分布受到了广泛关注.实证研究表明,大量真实网络具有幂律的低阶集团度分布,而且分布指数随集团阶数的上升呈下降趋势.这一普适规律无法由Holme和Kim(HK)模型的熟人推荐机制再现.在HK模型中考虑网络演化的加速增长这一重要因素,提出一种改进的HK模型.数值模拟显示,改进的HK模型生成网络的簇系数较大,平均最短路径较小,不仅具有小世界效应和无标度特性,而且再现了真实网络的低阶幂律集团度分布特性.此研究有利于更好地认识真实网络中的各阶基元. 相似文献
5.
6.
一种结合共同邻居和用户评分信息的相似度算法 总被引:1,自引:0,他引:1
随着互联网的发展,推荐系统逐步得到广泛应用,协同过滤(CF)是其中运用得最早.最成功的技术之一.CF首先根据用户间的相似度,找出每个用户的近邻;然后根据目标用户近邻的评分预测目标用户的评分;最后把预测评分较高的项目推荐给目标用户.因此相似度计算方法直接关系到预测结果的准确性,对推荐起着至关重要的作用.目前,学者们已从不同的角度提出了各种各样的相似度计算方法,其中共同邻居算法(common-neighbors)是一种简单有效的方法.但此法仅考虑了两用户间的共同邻居数,忽略了用户的具体评分信息.针对这个问题对共同邻居算法进行了改进,同时考虑了共同邻居数和用户的评分信息.实验结果表明,改进的共同邻居算法在一定程度上可提高评分预测的准确性. 相似文献
7.
8.
9.
针对传统预测方法无法有效预测Web舆情的长期趋势中拐点的不足,提出一种长期趋势预测方法.该方法首先通过周期分析和层次聚类为每类已发生舆情事件的发展趋势建立类模型库,然后通过对待预测舆情事件已知发展趋势进行自适应变换后,应用最小二乘法从相应的类模型库中选取均方误差和最小的模型来预测该事件的未来发展趋势.实验证明,与传统方法相比该方法在预测舆情事件发展的长期趋势时有较高的关联度,能有效预测长期趋势中的拐点. 相似文献
10.