首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
从技术的角度看,洗钱侦测问题实际上是一个数据分析问题。本文首先给出了一个可疑交易判定模型,并提出了一个基于超图模型的高维聚类算法,运用该算法从案例库中形成可疑交易模式,最后给出了可疑交易的判定方法。该基于超图的高维聚类算法具有以下特点:1)能处理大数据集;2)能适应高维数据;3)聚类结果是可理解、可解释和可用的。  相似文献   

2.
Mundur等提出了一种基于Delaunay三角网的聚类算法,并将其应用于视频帧的多维特征数据的聚类以生成视频摘要,取得了较好的效果。但是,该算法计算量太大,导致效率不高。为提高该算法的效率,以适合于对大数据集的处理,提出了一种改进的基于Delaunay三角网的聚类算法。通过在典型数据集上的实验,提出了一种新的确定全局聚类阈值的方法,使得计算量大为减少。实验结果表明,该算法无需用户提供聚类参数,也能得到良好的聚类结果,因此能够实现聚类过程自动化;并且计算速度更快,效率更高,适合于大数据集的处理。  相似文献   

3.
多层自动确定类别的谱聚类算法   总被引:1,自引:0,他引:1  
金慧珍  赵辽英 《计算机应用》2008,28(5):1229-1231
自动确定聚类数和海量数据的处理是谱聚类的关键问题。在自动确定聚类数谱聚类算法的基础上,提出了一种能处理大规模数据集的多层算法。该算法的核心思想是把大规模数据集根据一定的相关性逐级进行合并,使之成为小数据集,再对分组后的小数据集用自动确定类别的谱聚类算法聚类,最后逐层进行拆分并微调, 完成全部数据的聚类。实验证明该算法的聚类效果很好。  相似文献   

4.
针对密度峰值快速聚类(CFSFDP)算法对不同数据集聚类效果的差异,利用谱聚类对密度峰值快速聚类算法加以改进,提出了一种基于谱分析的密度峰值快速聚类算法CFSFDP-SA。首先,将高维非线性的数据集映射到低维子空间上实现降维处理,将聚类问题转化为图的最优划分问题以增强算法对数据全局结构的适应性;然后,利用CFSFDP算法对处理后的数据集进行聚类。结合这两种聚类算法各自的优势,能进一步提升聚类算法的性能。在5个人工合成数据集(2个线性数据集和3个非线性数据集)与4个UCI数据库中真实数据集上的聚类结果显示,相比CFSFDP算法,CFSFDP-SA算法的聚类精度有一定提升,在高维数据集的聚类精度上最多提高了14%,对原始数据集的适应性更强。  相似文献   

5.
模糊聚类是模式识别、机器学习和图像处理等领域的重要研究内容。模糊C-均值聚类算法是最常用的模糊聚类实现算法,该算法需要预先给定聚类数才能对数据集进行聚类。提出了一种新的聚类有效性指标,对聚类结果进行有效性验证。该指标从划分熵、隶属度、几何结构角度,定义了紧凑度、分离度、重叠度三个重要特征测量。在此基础上,提出了一种最佳聚类数确定方法。将新聚类有效性指标和传统有效性指标在6个人工数据集和3个真实数据集进行实验验证。实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合确定样本的最佳聚类数。  相似文献   

6.
传统的聚类算法不适用于处理海量和高维数据。针对云计算环境下,利用集群系统的并行计算能力,实现海量数据的聚类问题,给出了云计算环境下基于分形维数的聚类融合算法。该算法首先对基于分形维数的聚类算法进行改进,使之更适用于并行计算,其产生聚类作为初始聚类成员;再结合投票算法的融合策略实现融合。最后,对基于分形维数的聚类融合算法在云计算环境下实现并行计算。通过在UCI数据集上的对比实验来验证该算法的有效性。  相似文献   

7.
可能性C均值聚类算法(Possibilistic C-Means,PCM)相比于模糊C均值聚类算法(Fuzzy C-Means,FCM),能更好地处理含有噪音和例外点的数据,但在处理数据粘性较强的数据集时,PCM算法的聚类中心趋于一致,从而导致聚类算法直接失效。针对这个问题,提出了中心约束准则与跨域迁移学习准则,并将其应用到可能性C均值算法中,从而提出一种具有中心约束能力的聚类算法,简称中心约束的跨源学习聚类算法,改进后的算法能够利用跨域知识进行辅助聚类,确保类中心相互远离,从而能够保证算法的聚类性能。通过模拟数据集和真实数据集的实验,验证了该算法的上述优点。  相似文献   

8.
为了提高海量高维小样本数据的聚类准确率和效率,提出一种基于递归文化基因和云计算分布式计算的高维大数据聚类系统。基于Spark分布式计算平台设计迭代的聚类系统,分为基于递归文化基因的特征归简处理和基于密度的聚类处理。前者将基因微阵列的聚类准确率结果作为主目标,特征数量作为次目标,递归地化简特征空间;后者基于犹豫模糊集理论设计基于密度的聚类算法,采用加权的犹豫模糊集相关系数度量数据之间的距离。基于人工合成数据集和临床实验数据集均进行仿真实验,结果表明该算法在聚类准确率、扩展性和时间效率上均实现了较好的效果。  相似文献   

9.
利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点。但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低。基于主动学习技术研究标签数据选取,提出了一个新的半监督聚类算法。该算法结合最小生成树聚类和主动学习思想,选取包含信息较多的数据点作为标签数据,使用类KNN思想对类标签进行传播。通过在UCI标准数据集和模拟数据集上的测试,结果表明提出的算法比其他算法在处理多密度、不平衡数据集时有更高精度且稳定的聚类结果。  相似文献   

10.
孙秀娟  刘希玉 《计算机应用》2008,28(12):3244-3247
在K-means算法中,聚类数k是影响聚类质量的关键因素之一。目前,已经提出了许多确定最佳k值的聚类有效性方法,但这些方法都不能很好地处理两种数据集:类(簇)密度不同的数据集和类间距比较小的数据集(含有合并簇的数据集)。为此,提出了一种新的聚类有效性函数,该函数定义为数据特征轴总长度的平方与最小类间距的比值,最佳聚类数为这个比值达到最小时对应的k值。同时,为减小K-means算法对噪声和孤立点数据的敏感性,使用了基于加权的改进K-平均的方法计算类中心。实验证明,与其他算法相比,基于新聚类有效性函数的K-wmeans算法不仅降低了噪声和孤立点数据对聚类结果的影响,而且能有效地处理上面提到的两种数据集,明显提高了数据聚类质量。  相似文献   

11.
该文介绍了当前反洗钱领域中的一些经验,并且提出了一种基于特征向量中心度量的可疑洗钱识别算法,该算法针对可疑洗钱行为中的存在的交易网络进行全局识别。同时,该文提供了一个基于MATLAB的算法仿真。  相似文献   

12.
针对跨行洗钱犯罪的复杂性和协作性,在中央银行大额支付系统(HVPS)框架内,综合有限信息管理新方法,构建了新型的反洗钱管理模型。该模型采用分布式检测点采集排队队列中的洗钱信息,从而对大额支付系统中的协作洗钱犯罪进行整合的动态跟踪。它采用了基于事件的描述方法记录洗钱犯罪过程,应用灰色关联度算法实现大额支付系统中的多检测点信息融合,通过有限信息发掘出大额支付系统中的异常操作行为,最终应用功率谱估计算法实现洗钱犯罪的快速分析与识别。仿真测试结果证明,该模型与传统的反洗钱管理模型相比,洗钱客户覆盖率和发现精确度超过12%以上,而洗钱事件召回率提高了5%以上。从总体来看,该模型具有较高的信息处理效率和处理精度。  相似文献   

13.
Agent技术在仿真与虚拟现实中得到了广泛的应用,在反洗钱的研究过程中,因为诸多原因不能获取现实中的金融交易数据仓库,为了构建反洗钱研究模拟平台所需要的数据仓库并对现有的反洗钱监测理论方法进行验证,文中提供了采用智能Agent角色模拟的实现方式,设计了基于不同角色目标的个体Agent模型及决策模型,并对所得到的数据进行了分析验证,使Agent技术在金融网络研究中得到了进一步的应用。  相似文献   

14.
针对现行的反洗钱系统的缺陷,该文将模式识别Agent引入反洗钱系统设计,充分发挥Agent系统自主性、反应性、协作性的特点,构造了基于多Agent客户识别的反洗钱系统模型。并对多Agent通信、协商、实现与支持向量机模式识别等关键技术进行了研究。从而为反洗钱系统的实现提供了支持。  相似文献   

15.
本文针对当前洗钱犯罪活动迅速发展并呈现网络化的问题,提出了基于分布式智能代理框架的反网络洗钱技术,并结合关系图熵矩阵的数据挖掘技术,开发了反网络洗钱的仿真实验原型系统进行仿真验证。  相似文献   

16.
基于RBF神经网络的可疑交易监测模型   总被引:2,自引:0,他引:2       下载免费PDF全文
针对国内外金融领域可疑交易的低检测率问题,通过对RBF(Radial Basis Function)神经网络技术的分析与研究,提出了一种基于APC-III聚类算法和RLS(Recursive Least Square)算法的面向反洗钱的RBF神经网络模型并加以实现。APC-III聚类算法用于确定RBF神经网络隐含层的中心向量,RLS算法用来调整隐含层与输出层之间的连接权值。RBF神经网络与支持向量机(SVM)和孤立点检测相比,有更高的检测率和较低的误检率,因此,提出的模型具有重要的理论和实用价值。  相似文献   

17.
针对可疑洗钱识别问题,提出了基于交易网络特征向量中心度量的可疑洗钱行为检测系统.检测系统包含交易数据预处理、特征向量中心度量、时序检测分析三个关键子算法.同时还给出了三种用于检测异常交易行为的度量指标.通过对银行交易数据进行的实验仿真,验证了系统的有效性.  相似文献   

18.
针对利用金融机构进行洗钱的犯罪行为,为了提高可疑行为客户的识别效率,智能信息技术与KYC标准的结合为反洗钱工作提供了新的思路。论文将模式识别技术应用于反洗钱领域,提出基于聚类方法的客户交易行为模式识别,通过判断客户交易行为模式,识别具有异常交易行为的可疑客户。实验结果验证了该方法的可行性与有效性。  相似文献   

19.
Money laundering has been affecting the global economy for many years. Large sums of money are laundered every year, posing a threat to the global economy and its security. Money laundering encompasses illegal activities that are used to make illegally acquired funds appear legal and legitimate. This paper aims to provide a comprehensive survey of machine learning algorithms and methods applied to detect suspicious transactions. In particular, solutions of anti-money laundering typologies, link analysis, behavioural modelling, risk scoring, anomaly detection, and geographic capability have been identified and analysed. Key steps of data preparation, data transformation, and data analytics techniques have been discussed; existing machine learning algorithms and methods described in the literature have been categorised, summarised, and compared. Finally, what techniques were lacking or under-addressed in the existing research has been elaborated with the purpose of pinpointing future research directions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号