首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
章宁  陈钦 《计算机应用》2018,38(10):3042-3047
针对目前P2P贷款违约预测模型受限于借贷双方信息不对称性,未考虑投资人之间差异性的问题,提出了基于信息检索词频-逆文本频率(TF-IDF)算法的P2P贷款违约预测模型。首先以投资效用理论为基础,利用投资人历史投资收益率、贷款利率出价等信息,建立基于投资人效用的贷款违约预测模型;然后,借鉴信息检索TF-IDF算法,构造投资人逆向投资比例因子,对投资人差异性进行量化度量,优化模型中投资人权重计算因子。实验结果表明,该模型预测准确度与其他模型相比平均提高了6%左右,并在不同的测试数据集上都保持最优。  相似文献   

2.
基于有限样本的最优费用关联值递归Q学习算法   总被引:4,自引:2,他引:4  
一个激励学习Agent通过学习一个从状态到动作映射的最优策略来求解决策问题。求解最优决策一般有两种途径,一种是求最大奖赏方法,另一种是求最优费用方法。该文利用求解最优费用函数的方法给出了一种新的Q学习算法。Q学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法。文章从求解最优费用函数的方法出发,给出了Q学习的关联值递归算法,这种方法的建立,可以使得动态规划(DP)算法中的许多结论直接应用到Q学习的研究中来。  相似文献   

3.
人工智能促进了风控行业的发展,智能风控的核心在于风险控制,信贷违约预测模型是解决这一问题必须倚靠的手段.传统的解决方案是基于人工和广义线性模型建立的,然而现在通过网络完成的交易数据,具有高维性和多重来源等特点,远远超出了现有模型的处理能力,对于传统风控提出了巨大的挑战.因此,本文提出一种基于融合方法的可解释信贷违约预测模型,首先选取LightGBM、DeepFM和CatBoost作为基模型,CatBoost作为次模型,通过模型融合提升预测结果的准确性,然后引入基于局部的、与模型无关的可解释性方法LIME,解释融合模型的预测结果.基于真实数据集的实验结果显示,该模型在信贷违约预测任务上具有较好的精确性和可解释性.  相似文献   

4.
随着经济社会的高速发展和工业化建设程度不断提高,水环境问题已经严重影响甚至威胁了人类的健康。近年来,国家大力推行水环境的预测预警,许多专家学者利用人工神经网络等智能方法在富营养化评价及水华预测中得到了较为广泛的运用,也取得了一定成效。然而,人工神经网络的性能受到样本训练算法等方面的影响,在选取合适的神经网络模型、算法以及设置参数麻烦、耗时。随着问题复杂程度的增加,单个网络的隐层节点数将增加很多,训练时间将大大增加,从而造成训练困难。且由于训练过度或不够,往往导致泛化能力较差。为解决此问题,本文在对湖库水华形成机理深入分析的基础上,建立了BP网络的水华预测模型,并利用Bootstrap采样技术获取不同的数据集,分别训练多个BP网络,最终将多个网络进行集成用于建立太湖流域水华预测模型。通过基于Bagging算法的集成学习,可以对样本包含的信息进行充分挖掘,更全面的刻画因素之间的相互联系和变化规律。实验表明基于Bagging算法的BP网络集成模型预测结果与单个BP网络模型预测结果对比,具有较高的预测能力,从而获得了相对理想的预测效果。  相似文献   

5.
针对连续空间下的强化学习控制问题,提出了一种基于自组织模糊RBF网络的Q学习方法.网络的输入为状态,输出为连续动作及其Q值,从而实现了“连续状态—连续动作”的映射关系.首先将连续动作空间离散化为确定数目的离散动作,采用完全贪婪策略选取具有最大Q值的离散动作作为每条模糊规则的局部获胜动作.然后采用命令融合机制对获胜的离散动作按其效用值进行加权,得到实际作用于系统的连续动作.另外,为简化网络结构和提高学习速度,采用改进的RAN算法和梯度下降法分别对网络的结构和参数进行在线自适应调整.倒立摆平衡控制的仿真结果验证了所提Q学习方法的有效性.  相似文献   

6.
如何有效预测房屋价格,对地方经济发展具有十分重要的作用。房屋价格作为一个综合指标,受诸多因素的影响,目前的房价预测模型大多数为单一模型,存在精度低、泛化能力差、容易过拟合等缺点。针对这些问题,提出基于特征选择与集成学习的房价预测模型。首先,选用ElasticNet、LightGBM、支持向量回归(Support Vector Regression,SVR)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)作为基础模型,采用随机森林进行特征重要度排序,并进行特征选择。其次,对这4个基础模型分别进行训练,使用blending方式进行融合。最后,在AmesHousing数据集上验证这个模型的有效性。验证结果表明,相对于单一的预测模型,集成学习模型能够提高预测精度,具有更好的泛化性能。  相似文献   

7.
闫忻保 《软件》2023,(2):144-146
近年来计算机软件在信息技术、文化教育、生物医疗以及军事等领域都得到了广泛且深入的应用,并且用户需求持续增多,软件功能愈加复杂多样。软件开发使用的效率以及质量问题随之凸显出来。软件测试作为贯穿软件设计工程全过程的重要环节,通过多种多样的成熟的测试技术及时发现并且排除软件中存在的问题缺陷来提高软件的整体设计效率和质量、降低软件系统设计开发的成本。软件缺陷预测技术则是对软件测试任务进行指导和评估的重要途径,缺陷预测技术可以精准地进行预测软件缺陷的分布情况对软件测试工作的推进有着重要的指导作用。本文将深入研究集成学习在软件缺陷预测技术领域的发展与应用。  相似文献   

8.
针对现有基于策略梯度的深度强化学习方法应用于办公室、走廊等室内复杂场景下的机器人导航时,存在训练时间长、学习效率低的问题,本文提出了一种结合优势结构和最小化目标Q值的深度强化学习导航算法.该算法将优势结构引入到基于策略梯度的深度强化学习算法中,以区分同一状态价值下的动作差异,提升学习效率,并且在多目标导航场景中,对状态价值进行单独估计,利用地图信息提供更准确的价值判断.同时,针对离散控制中缓解目标Q值过估计方法在强化学习主流的Actor-Critic框架下难以奏效,设计了基于高斯平滑的最小目标Q值方法,以减小过估计对训练的影响.实验结果表明本文算法能够有效加快学习速率,在单目标、多目标连续导航训练过程中,收敛速度上都优于柔性演员评论家算法(SAC),双延迟深度策略性梯度算法(TD3),深度确定性策略梯度算法(DDPG),并使移动机器人有效远离障碍物,训练得到的导航模型具备较好的泛化能力.  相似文献   

9.
多种慢性疾病若不能得到有效诊断和治疗会引发综合征,因此疾病的早期识别和诊断在临床实践中发挥着重要作用.目前提出的模型都假设用于训练模型的数据是完美的,而现实的医学数据中通常存在大量的缺失值和类别不平衡,这两个问题严重阻碍了模型的预测能力.为此,以糖尿病为例提出了一种基于集成学习的疾病预测模型,并且在评价模型的过程中采用...  相似文献   

10.
多元时间序列包含丰富的变量,且变量间存在着相关性,相互影响,可能会降低某一变量的预测精度.为此,本文提出了一种基于RNN和CNN的混合模型.模型利用互信息法进行特征选择,通过融合CNN的抽象特征提取以及GRU的时序信息提取来预测未来7个单位时刻的数据.实验表明,模型的预测效果优于LSTM等模型.此外,为了检验所构建的模型的泛用性,在PM2.5数据集和SML2010数据集上进行了对比测试,同样证明了模型的优越性.  相似文献   

11.
当前集成学习中的结合策略难以兼顾各个基学习器之间的信息和模型的可解释性。使用证据推理(evidential reasoning,ER)规则作为结合策略,将各个基学习器结果作为证据参与融合,可以较好地解决以上问题。但传统ER规则的证据参数是单一的,对不同的基学习器模型使用相同的证据参数显然是不合理的。为此,提出一种基于自适应证据推理(adaptive-evidential reasoning,A-ER)规则的集成学习方法,该方法在每次证据融合前对证据的类别进行判断,针对不同的证据类别自适应分配不同的证据参数。通过不同的分类案例表明,该方法与案例中其他方法相比具有更高的分类精度,证明了该方法使证据参数设置更加合理且具有更好的可解释性和泛化能力。  相似文献   

12.
基于AUC的分类器评价和设计综述   总被引:2,自引:0,他引:2  
尽管精度(或总体错分率)普遍用作分类算法的性能评价指标,但存在诸如敏感于类先验分布和错分代价,忽略分类算法所得的后验概率或排序信息等不足。而接收者操作特性(ROC)曲线下面积则能度量算法在整个类先验分布及错分代价范围内的总体分类性能、后验概率和排序性能,因此在分类学习中受到越来越多的关注,由此涌现出众多研究成果。文章旨在对此作相对全面的回顾和总结,包括AUC作为性能评价指标的优势所在,基于AUC优化的算法设计,基于精度优化和AUC优化的算法间的关系以及AUC存在的不足及改进。  相似文献   

13.
当标识示例的两个标签分别来源于两个标签集时,这种多标签分类问题称之为标签匹配问题,目前还没有针对标签匹配问题的学习算法。 尽管可以用传统的多标签分类学习算法来解决标签匹配问题,但显然标签匹配问题有其自身特殊性。 通过对标签匹配问题进行深入的研究,在连续AdaBoost(real Adaptive Boosting)算法的基础上,基于整体优化的思想,采用算法适应的方法,提出了基于双标签集的标签匹配集成学习算法,该算法能够较好地学习到标签匹配规律从而完成标签匹配。 实验结果表明,与传统的多标签学习算法用于解决标签匹配问题相比,提出的新算法不仅缩小了搜索的标签空间的范围,而且最小化学习误差可以随着分类器个数的增加而降低,进而使得标签匹配分类更加快速、准确。  相似文献   

14.
基于集成学习的自训练算法是一种半监督算法,不少学者通过集成分类器类别投票或平均置信度的方法选择可靠样本。基于置信度的投票策略倾向选择置信度高的样本或置信度低但投票却一致的样本进行标记,后者这种情形可能会误标记靠近决策边界的样本,而采用异构集成分类器也可能会导致各基分类器对高置信度样本的类别标记不同,从而无法将其有效加入到有标记样本集。提出了结合主动学习与置信度投票策略的集成自训练算法用来解决上述问题。该算法合理调整了投票策略,选择置信度高且投票一致的无标记样本加以标注,同时利用主动学习对投票不一致而置信度较低的样本进行人工标注,以弥补集成自训练学习只关注置信度高的样本,而忽略了置信度低的样本的有用信息的缺陷。在UCI数据集上的对比实验验证了该算法的有效性。  相似文献   

15.
入侵检测系统(IDS)已成为网络安全体系结构中的必要组成部分。在面对现代网络安全需求时,现有的入侵检测方法的可行性和持续性仍然存在提高空间,主要体现在更早地发现入侵威胁和提高入侵检测系统的检测精准度,为此提出一种基于互信息加权的集成迁移学习(ETL)入侵检测方法。首先,通过迁移策略对多组特征集进行建模;然后,使用互信息度量在迁移模型下特征集在不同域中的数据分布;最后,根据度量值对多个迁移模型进行集成加权,得到集成迁移模型。该方法通过学习新环境下的少量有标记样本和以往环境下的大量有标记样本的知识,可以建立效果优于传统非集成、非迁移的入侵检测模型。使用基准NSL-KDD数据集对该方法进行评估,实验结果表明,所提方法具有良好的收敛性能,并提高了入侵检测的精准率。  相似文献   

16.
Although classification in centralized environments has been widely studied in recent years, it is still an important research problem for classification in P2P networks due to the popularity of P2P computing environments. The main target of classification in P2P networks is how to efficiently decrease prediction error with small network overhead. In this paper, we propose an OS-ELM based ensemble classification framework for distributed classification in a hierarchical P2P network. In the framework, we apply the incremental learning principle of OS-ELM to the hierarchical P2P network to generate an ensemble classifier. There are two kinds of implementation methods of the ensemble classifier in the P2P network, one-by-one ensemble classification and parallel ensemble classification. Furthermore, we propose a data space coverage based peer selection approach to reduce high the communication cost and large delay. We also design a two-layer index structure to efficiently support peer selection. A peer creates a local Quad-tree to index its local data and a super-peer creates a global Quad-tree to summarize its local indexes. Extensive experimental studies verify the efficiency and effectiveness of the proposed algorithms.  相似文献   

17.
针对卷积神经网络提取特征信息不完整导致图像分类方法分类精度不高等问题,利用深度学习的方法搭建卷积神经网络模型框架,提出一种基于迭代训练和集成学习的图像分类方法。利用数据增强对图像数据集进行预处理操作,在提取图像特征时,采用一种迭代训练卷积神经网络的方式,得到充分有效的图像特征,在训练分类器时,采用机器学习中集成学习的思想。分别在特征提取后训练分类器,根据各分类器贡献的大小,赋予它们不同的权重值,取得比单个分类器更好的性能,提高图像分类的精度。该方法在Stanford Dogs、UEC FOOD-100和CIFAR-100数据集上的实验结果表明了其较好的分类性能。  相似文献   

18.
链接预测是社会网络分析领域的关键问题。传统的链接预测方法大多针对社会网络的静态结构预测隐含的链接或者将来可能产生的链接,而忽视了网络在动态演变过程中的潜在信息。为了能更好地利用网络演变的动态信息,从而取得更好的链接预测效果,提出了一种基于网络结构演变规律的链接预测方法。该方法使用机器学习技术对网络结构特征的动态变化信息进行训练,学习每种结构特征的变化并得到一个分类器,为每个分类器加权得到最终集成的结果。在三个现实的合著者网络数据集上的实验结果表明,该方法的性能要高于静态链接预测方法和一个相关的动态链接预测方法。这说明,网络结构演变信息有助于提高链接预测效果。此外,实验还表明,不同的结构特征对网络动态变化的刻画能力也有所差别。  相似文献   

19.
集成多个传感器的智能片上系统( SoC)在物联网得到了广泛的应用.在融合多个传感器数据的分类算法方面,传统的支持向量机( SVM)单分类器不能直接对传感器数据流进行小样本增量学习.针对上述问题,提出一种基于Bagging-SVM的集成增量算法,该算法通过在增量数据中采用Bootstrap方式抽取训练集,构造能够反映新信息变化的集成分类器,然后将新老分类器集成,实现集成增量学习.实验结果表明:该算法相比SVM单分类器能够有效降低分类误差,提高分类准确率,且具有较好的泛化能力,可以满足当下智能传感器系统基于小样本数据流的在线学习需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号