首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 250 毫秒
1.
传统医保信息欺诈检测算法存在运行时间长、效率低的问题,无法保障患者医保信息安全,为了解决该问题,采用基于随机森林算法对失稳网络医保信息欺诈行为进行检测。通过混合抽样可抽取在失稳情况下的数据,并建立非平衡数据分类算法抽样机制;进行迭代随机森林数据计算,采用多数投票法构建基分类器,并以此为基础筛选异常数据;利用模型实现该算法对医保信息欺诈检测。设计对比实验,验证该算法有效性。通过实验结果可知,基于随机森林算法运行时间较短、效率高。  相似文献   

2.
随着金融机构信用卡业务的快速发展,信用卡欺诈行为成为金融机构面临的严峻问题。针对金融机构信用卡数据分布不均衡问题,本文采用过采样、降采样、SMOTE+ENN、SMOTE+Tomeklin、改进的SMOTE+Tomeklin和改进的SMOTE+ENN混合采样这6种不同采样方法对不平衡数据进行平衡处理,然后将平衡数据集输入到多种分类算法模型中进行实验比对,最后提出一种基于改进的SMOTE+ENN混合采样和XGBoost算法的信用卡欺诈行为检测模型。通过5种评价指标验证该检测方法不仅提高了信用卡欺诈行为不平衡数据的区分度,同时提高了信用卡欺诈行为检测的准确性和可行性。  相似文献   

3.
网络在线广告中以套取广告费为目的的点击欺诈已经严重影响了网络广告的稳定发展。从FDMA2012竞赛提供的欺诈发布商检测的真实数据集出发,针对冗余特征会降低训练效率以及不平衡数据会使决策边界发生偏倚的问题,提出了一种基于集成特征选择的网络在线广告点击欺诈检测方法。采用Bagging方法和合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)相结合的方法将多数的正常点击广告发布商样本与少数的欺诈点击广告发布商样本构造为多个袋装子集,利用基于相关性度量的特征选择算法对每个袋装子集中筛选出特征子集,设置阈值得到特征合集,利用随机森林算法构建点击欺诈检测模型。实验结果表明该方法能够有效识别出实施欺诈点击行为的非法发布商,达到网络在线广告中点击欺诈检测的要求。  相似文献   

4.
医保欺诈造成严重经济损失,对医保制度的安全稳定造成巨大冲击.然而,现有工作难以支持对多类欺诈行为的联合分析和探索.基于多维时序相关的医保数据,提出面向医保反欺诈的联合可视分析方法.该方法支持医保数据的时空多角度过滤,以更快地定位欺诈;并通过不同类别、不同主体的欺诈之间的关联分析,挖掘出隐蔽的欺诈行为;与医保领域专家合作,设计并实现一个面向医保反欺诈的可视分析系统MedicareVis,通过真实医保数据上的实例研究与专家访谈,证明该方法在帮助检测欺诈行为关联上的有效性和实用性.  相似文献   

5.
董亚楠  刘学军  李斌 《计算机科学》2016,43(10):145-149
在线广告是目前众多网络巨头收入的主要来源,在线广告也为网络的健康发展提供了强大的经济支撑。目前,利用用户行为属性特征来识别点击欺诈的方法中,含有较多的冗余特征,检测效率相对较低。针对这一问题,提出了一种属性特征选择与分类方法相结合的欺诈检测方法。通过训练数据集找到欺诈用户点击广告的属性特征集合,采用Fisher分方法得到了属性特征重要度排序,选取重要属性特征,并基于这些重要的特征使用支持向量机二分类方法分类。在真实数据集上的实验结果证明了该方法的可行性与有效性。  相似文献   

6.
陶涛  周喜  马博  赵凡 《计算机应用》2019,39(3):924-929
加油时序数据包含加油行为的多维信息,但是指定加油站点数据较为稀疏,现有成熟的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷,并不适用于挖掘加油站时序数据。提出一种基于深度学习的异常检测方法识别加油异常车辆,首先通过自动编码器对加油站点采集到的相关数据进行特征提取,然后采用嵌入双向长短期记忆(Bi-LSTM)的Seq2Seq模型对加油行为进行预测,最后通过比较预测值和原始值来定义异常点的阈值。通过在加油数据集以及信用卡欺诈数据集上的实验验证了该方法的有效性,并且相对于现有方法在加油数据集上均方根误差(RMSE)降低了21.1%,在信用卡欺诈数据集上检测异常的准确率提高了1.4%。因此,提出的模型可以有效应用于加油行为异常的车辆检测,从而提高加油站的管理和运营效率。  相似文献   

7.
网络入侵数据是一种典型的非平衡数据,小类样本常被大类样本"淹没"。本文针对网络入侵检测的非平衡数据集,对SVM-RFE特征选择算法进行了改进。通过将大类样本数据聚类成N份数量与小类样本相当的数据集,并分别与小类样本组合成N个新的训练数据集,在此基础上使用SVM-RFE算法,并利用SVM进行分类。通过在KDD CUP99入侵检测数据集上的实验,验证了本方法的有效性。  相似文献   

8.
针对行业欺诈行为形式多样、操作隐蔽,且数据分布极端不平衡等问题,研究采用ADASYN(adaptive synthetic sampling approach for imbalanced learning)算法将分类决策边界向困难的实例进行自适应移动实现数据扩增,以解决不平衡数据造成的过拟合问题。采用基于随机森林的序列向前搜索策略算法筛选出最优特征子集对欺诈进行检测,降低ADASYN算法添加噪声数据对分类边界确定的影响,构建欺诈检测模型,并使用LIME对模型检测结果作出局部解释,提高模型的使用价值。实验表明,该模型可以较好地克服传统欺诈检测模型对多数类样本误分类的缺陷,有助于提高行业对交易欺诈行为识别的效率。同时,通过LIME对模型检测出的随机样本进行有效解析,便于决策者对算法模型的检测结果作出实证分析,起到明显的预警及决策参考价值。  相似文献   

9.
针对目前视频中暴力行为识别算法识别准确率不高的问题,提出一种基于人体关节点多特征融合的暴力行为识别方法。使用YOLO-Pose算法实现人体检测与姿态估计,获取人体关节点位置信息,基于人体结构提取关节点的距离特征和形状特征,基于运动特性提取关节点的动态特征和姿态特征,将所有特征信息进行融合,构建Bi-LSTM行为识别模型实现暴力行为识别分类,并设计行为识别结果稳定器,解决识别过程中因随机干扰导致的行为误判问题。在公开暴力行为数据集Violent-Flows与自制暴力行为数据集Vio-B上验证提出方法的有效性,实验表明,在Violent-Flows数据集与Vio-B数据集上本方法准确率分别达到97.9%与98.5%,高于现有方法。  相似文献   

10.
田臣  周丽娟 《计算机应用》2019,39(6):1707-1712
针对信用评估中最为常见的不均衡数据集问题以及单个分类器在不平衡数据上分类效果有限的问题,提出了一种基于带多数类权重的少数类过采样技术和随机森林(MWMOTE-RF)结合的信用评估方法。首先,在数据预处理过程中利用MWMOTE技术增加少数类别样本的样本数;然后,在预处理后的较平衡的新数据集上利用监督式机器学习算法中的随机森林算法对数据进行分类预测。使用受测者工作特征曲线下面积(AUC)作为分类评价指标,在UCI机器学习数据库中的德国信用卡数据集和某公司的汽车违约贷款数据集上的仿真实验表明,在相同数据集上,MWMOTE-RF方法与随机森林方法和朴素贝叶斯方法相比,AUC值分别提高了18%和20%。与此同时,随机森林方法分别与合成少数类过采样技术(SMOTE)方法和自适应综合过采样(ADASYN)方法结合,MWMOTE-RF方法与它们相比,AUC值分别提高了1.47%和2.34%,从而验证了所提方法的有效性及其对分类器性能的优化。  相似文献   

11.
特征树阀值检测算法应对电信欺诈   总被引:3,自引:0,他引:3  
李春霖  李文高 《软件》2011,32(1):8-13
电信网络日益复杂,这增加了电信营运的难度,并且大额欺诈和恶意欠费的状况使电信运营收入存在较大的风险。本文在数据挖掘技术、基于聚类的层次分析算法等理论基础上,采用了欺诈特征树阀值检测算法来应对电信欺诈,防范电信运营收入的流失。该算法将用户的数据特征项构建成欺诈特征树,采用关系数据模式来组织用户的欺诈特征项,并设定结点阀值作为检测判断的依据,依照用户最后的欺诈度值判断用户是否欺诈。算法简单高效,系统占用较少的内存并获得了较高的准确率。  相似文献   

12.
随着保险行业的蓬勃发展,保险欺诈问题也显得日趋严重。车险欺诈一直是保险欺诈的“重灾区”,对保险行业的发展至关重要。因此,车险欺诈检测技术一直是国内外学者研究的热点问题。鉴于我国在机动车辆保险欺诈检测技术方相对滞后,而国外的研究成果又较少对我国车险业务数据进行有效建模与分析,首次针对机器学习模型应用在车险欺诈检测的研究工作进行了文献调研,对二十多年来的研究工作进行系统化的归纳与总结。通过引入车险欺诈流程的简介,对专家系统与智能理赔系统在车险欺诈检测的流程进行了叙述;依次从国外和国内的角度介绍了机器学习模型应用在车险欺诈检测的具体研究进展,并进行了宏观的对比;基于国内某车险公司提供近5年来高质量的车险数据选取具有代表性的机器学习模型进行建模,并进行了全面的测试与分析;探讨了车险欺诈检测技术未来的研究方向。  相似文献   

13.
医疗保险欺诈是指在参加医保的过程中,通过故意捏造、虚构事实等方法骗取医保基金或医保待遇,造成医疗保险基金损失的行为.有效地识别医保欺诈对医保基金的健康使用有重大意义.本文运用BP神经网络实现医保欺诈的主动识别,并利用Logistic回归分析对神经网络模型进行改进,降低弱因子对神经网络识别的干扰.此外,应对欺诈数据的稀缺问题,采用只取正常数据训练神经网络模拟函数曲线的模式.实证表明,该方法对医保欺诈具有较好的识别能力.  相似文献   

14.
刘舒舒  杨鹤标 《微机发展》2013,(12):171-174
针对医疗保险中屡屡出现的违规和欺诈行为,提出了一种基于多Agent的医疗保险欺诈检测系统。在系统中,通过利用Agent的智能性和多Agent的协同性对欺诈行为的检测做出决策。在决策过程中,各个Agent独立运行同时又互相合作,通过黑板机制进行互相的通信和交流,实现对欺诈行为的实时监控。文中阐述了该系统的总体结构、组成部分、工作机制以及实现的关键技术,并在JADE平台基础上进行了实证。通过实证,证明了系统具有灵活性、跨平台性和安全性等优点。  相似文献   

15.
Bagging组合的不平衡数据分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
秦姣龙  王蔚 《计算机工程》2011,37(14):178-179
提出一种基于Bagging组合的不平衡数据分类方法CombineBagging,采用少数类过抽样算法SMOTE进行数据预处理,在此基础上利用C-SVM、径向基函数神经网络、Random Forests 3种不同的基分类器学习算法,分别对采样后的数据样本进行Bagging集成学习,通过投票规则集成学习结果。实验结果表明,该方法能够提高少数类的分类准确率,有效处理不平衡数据分类问题。  相似文献   

16.
针对无线传感器网络(WSN)入侵检测方法在离散高维特征的不平衡数据集上检测精度低和泛化能力差的问题,提出一种基于双向循环生成对抗网络的WSN入侵检测方法 BiCirGAN。首先,引入对抗学习异常检测(ALAD)通过潜在空间合理地表示高维、离散的原始特征,提高对原始特征的可理解性。其次,采用双向循环对抗的结构确保真实空间和潜在空间双向循环的一致性,从而保证生成对抗网络(GAN)训练的稳定性,并提高异常检测的性能。同时,引入Wasserstein距离和谱归一化优化方法改进GAN的目标函数,以进一步解决GAN的模式崩坏与生成器缺乏多样性的问题。最后,由于入侵攻击数据的统计属性随时间以不可预见的方式变化,建立带有Dropout操作的全连接层网络对异常检测结果进行优化。实验结果表明,在KDD99、UNSW-NB15和WSN_DS数据集上,相较于AnoGAN、BiGAN、MAD-GAN以及ALAD方法,BiCirGAN在检测精确度上提高了3.9%~33.0%,且平均推断速度是ALAD方法的4.67倍。  相似文献   

17.
针对电子设备故障检测问题中故障机理复杂、故障样本贫瘠的问题,提出一种SL-SMOTE(Safe Level Synthetic Minority Oversampling TEchnique)和代价敏感相关向量机(Cost Sensitive Relevance Vector Machine,CS-RVM)结合的电子设备故障检测方法。所提方法将电子设备的故障检测视为一个非平衡的二分类问题,首先在数据层采用SL-SMOTE对故障样本进行拓展,然后根据优化后的样本训练得到RVM检测器,最后将代价敏感学习引入到检测结果的判别中,得到损失代价最小的检测结果。UCI数据集以及应用案例的实验结果表明所提方法有效提高了检测正确率。  相似文献   

18.
报警融合是入侵检测系统中很重要的一个环节,然而不同的攻击类型具有不同的数据特点,统一的无差别的处理方法势必会存在缺陷。提出了采用基于支持向量数据描述的报警融合算法,并且结合模拟退火的思想,根据不同的攻击类型,选择适合它的属性和核参数,剔除冗余特征,避免样本不均衡产生的影响,通过局部检测、数据融合以及最终的决策分析,提高了报警的检测率,降低了漏报率。通过KDD99数据集对提出的方法进行了验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号