首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 578 毫秒
1.
针对密度峰值快速聚类(CFSFDP)算法对不同数据集聚类效果的差异,利用谱聚类对密度峰值快速聚类算法加以改进,提出了一种基于谱分析的密度峰值快速聚类算法CFSFDP-SA。首先,将高维非线性的数据集映射到低维子空间上实现降维处理,将聚类问题转化为图的最优划分问题以增强算法对数据全局结构的适应性;然后,利用CFSFDP算法对处理后的数据集进行聚类。结合这两种聚类算法各自的优势,能进一步提升聚类算法的性能。在5个人工合成数据集(2个线性数据集和3个非线性数据集)与4个UCI数据库中真实数据集上的聚类结果显示,相比CFSFDP算法,CFSFDP-SA算法的聚类精度有一定提升,在高维数据集的聚类精度上最多提高了14%,对原始数据集的适应性更强。  相似文献   

2.
从技术的角度看,洗钱侦测问题实际上是一个数据分析问题。本文首先给出了一个可疑交易判定模型,并提出了一个基于超图模型的高维聚类算法,运用该算法从案例库中形成可疑交易模式,最后给出了可疑交易的判定方法。该基于超图的高维聚类算法具有以下特点:1)能处理大数据集;2)能适应高维数据;3)聚类结果是可理解、可解释和可用的。  相似文献   

3.
提出了一种新型的聚类算法。这个新型的聚类算法是基于中心对称的概念之上的。使用这种基于中心对称性的聚类算法,在一个指定的数据集中的超球面形状的聚类能够被侦测出来。在对超球面性状的目标的侦测方面,这种聚类算法大大优于传统的算法。这个算法可以用于数据聚类和人脸识别方面,实验结果也证明了该算法的效果。  相似文献   

4.
针对密度峰值聚类算法(DPC)不能自动确定聚类中心,并且聚类中心点与非聚类中心点在决策图上的显示不够明显的问题,设计了一种自动确定聚类中心的比较密度峰值聚类算法(ACPC)。该算法首先利用距离的比较量来代替原距离参数,使潜在的聚类中心在决策图中更加突出;然后通过二维区间估计方法进行对聚类中心的自动选取,从而实现聚类过程的自动化。仿真实验结果表明,在4个合成数据集上ACPC取得了更好的聚类效果;而在真实数据集上的Accuracy指标对比表明,在Iris数据集上,ACPC聚类结果可达到94%,与传统的DPC算法相比提高了27.3%,ACPC解决了交互式选取聚类中心的问题。  相似文献   

5.
王军  周凯  程勇 《计算机应用》2019,39(2):403-408
密度峰值聚类(DP)算法是一种新的基于密度的聚类算法,当它处理的单个聚类包含多个密度峰值时,会将每个不同密度峰值视为潜在聚类中心,以致难以在数据集中确定正确数量聚类,为此,提出一种混合的密度峰值聚类算法C-DP。首先,以密度峰值点为初始聚类中心将数据集划分为子簇;然后,借鉴代表点层次聚类算法(CURE),从子簇中选取分散的代表点,将拥有最小距离的代表点对的类进行合并,引入参数收缩因子以控制类的形状。仿真实验结果表明,在4个合成数据集上C-DP算法比DP算法聚类效果更好;在真实数据集上的Rand Index指标对比表明,在数据集S1上,C-DP算法比DP算法性能提高了2.32%,在数据集4k2_far上,C-DP算法比DP算法性能提高了1.13%。由此可见,C-DP算法在单个类簇中包含多密度峰值的数据集中能提高聚类的准确性。  相似文献   

6.
Mundur等提出了一种基于Delaunay三角网的聚类算法,并将其应用于视频帧的多维特征数据的聚类以生成视频摘要,取得了较好的效果。但是,该算法计算量太大,导致效率不高。为提高该算法的效率,以适合于对大数据集的处理,提出了一种改进的基于Delaunay三角网的聚类算法。通过在典型数据集上的实验,提出了一种新的确定全局聚类阈值的方法,使得计算量大为减少。实验结果表明,该算法无需用户提供聚类参数,也能得到良好的聚类结果,因此能够实现聚类过程自动化;并且计算速度更快,效率更高,适合于大数据集的处理。  相似文献   

7.
多层自动确定类别的谱聚类算法   总被引:1,自引:0,他引:1  
金慧珍  赵辽英 《计算机应用》2008,28(5):1229-1231
自动确定聚类数和海量数据的处理是谱聚类的关键问题。在自动确定聚类数谱聚类算法的基础上,提出了一种能处理大规模数据集的多层算法。该算法的核心思想是把大规模数据集根据一定的相关性逐级进行合并,使之成为小数据集,再对分组后的小数据集用自动确定类别的谱聚类算法聚类,最后逐层进行拆分并微调, 完成全部数据的聚类。实验证明该算法的聚类效果很好。  相似文献   

8.
为了更好地解决密度不均衡问题与刻画高维数据相似性度量问题,提出一种基于共享[k]-近邻与共享逆近邻的密度峰聚类算法。该算法计算两个点的共享[k]-近邻数与共享逆近邻数,并结合欧氏距离来确定这两个点之间的共享相似度;将样本点与其逆近邻点的共享相似度之和定义为该点的共享密度,再通过共享密度选取聚类中心。通过实验证明,该算法在人工数据集和真实数据集上的聚类结果较其他密度聚类算法更加准确,并且能更好地处理密度不均衡问题,同时也提高了高维数据的聚类精度。  相似文献   

9.
模糊聚类是模式识别、机器学习和图像处理等领域的重要研究内容。模糊C-均值聚类算法是最常用的模糊聚类实现算法,该算法需要预先给定聚类数才能对数据集进行聚类。提出了一种新的聚类有效性指标,对聚类结果进行有效性验证。该指标从划分熵、隶属度、几何结构角度,定义了紧凑度、分离度、重叠度三个重要特征测量。在此基础上,提出了一种最佳聚类数确定方法。将新聚类有效性指标和传统有效性指标在6个人工数据集和3个真实数据集进行实验验证。实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合确定样本的最佳聚类数。  相似文献   

10.
可能性C均值聚类算法(Possibilistic C-Means,PCM)相比于模糊C均值聚类算法(Fuzzy C-Means,FCM),能更好地处理含有噪音和例外点的数据,但在处理数据粘性较强的数据集时,PCM算法的聚类中心趋于一致,从而导致聚类算法直接失效。针对这个问题,提出了中心约束准则与跨域迁移学习准则,并将其应用到可能性C均值算法中,从而提出一种具有中心约束能力的聚类算法,简称中心约束的跨源学习聚类算法,改进后的算法能够利用跨域知识进行辅助聚类,确保类中心相互远离,从而能够保证算法的聚类性能。通过模拟数据集和真实数据集的实验,验证了该算法的上述优点。  相似文献   

11.
该文介绍了当前反洗钱领域中的一些经验,并且提出了一种基于特征向量中心度量的可疑洗钱识别算法,该算法针对可疑洗钱行为中的存在的交易网络进行全局识别。同时,该文提供了一个基于MATLAB的算法仿真。  相似文献   

12.
针对跨行洗钱犯罪的复杂性和协作性,在中央银行大额支付系统(HVPS)框架内,综合有限信息管理新方法,构建了新型的反洗钱管理模型。该模型采用分布式检测点采集排队队列中的洗钱信息,从而对大额支付系统中的协作洗钱犯罪进行整合的动态跟踪。它采用了基于事件的描述方法记录洗钱犯罪过程,应用灰色关联度算法实现大额支付系统中的多检测点信息融合,通过有限信息发掘出大额支付系统中的异常操作行为,最终应用功率谱估计算法实现洗钱犯罪的快速分析与识别。仿真测试结果证明,该模型与传统的反洗钱管理模型相比,洗钱客户覆盖率和发现精确度超过12%以上,而洗钱事件召回率提高了5%以上。从总体来看,该模型具有较高的信息处理效率和处理精度。  相似文献   

13.
Agent技术在仿真与虚拟现实中得到了广泛的应用,在反洗钱的研究过程中,因为诸多原因不能获取现实中的金融交易数据仓库,为了构建反洗钱研究模拟平台所需要的数据仓库并对现有的反洗钱监测理论方法进行验证,文中提供了采用智能Agent角色模拟的实现方式,设计了基于不同角色目标的个体Agent模型及决策模型,并对所得到的数据进行了分析验证,使Agent技术在金融网络研究中得到了进一步的应用。  相似文献   

14.
针对现行的反洗钱系统的缺陷,该文将模式识别Agent引入反洗钱系统设计,充分发挥Agent系统自主性、反应性、协作性的特点,构造了基于多Agent客户识别的反洗钱系统模型。并对多Agent通信、协商、实现与支持向量机模式识别等关键技术进行了研究。从而为反洗钱系统的实现提供了支持。  相似文献   

15.
本文针对当前洗钱犯罪活动迅速发展并呈现网络化的问题,提出了基于分布式智能代理框架的反网络洗钱技术,并结合关系图熵矩阵的数据挖掘技术,开发了反网络洗钱的仿真实验原型系统进行仿真验证。  相似文献   

16.
基于RBF神经网络的可疑交易监测模型   总被引:2,自引:0,他引:2       下载免费PDF全文
针对国内外金融领域可疑交易的低检测率问题,通过对RBF(Radial Basis Function)神经网络技术的分析与研究,提出了一种基于APC-III聚类算法和RLS(Recursive Least Square)算法的面向反洗钱的RBF神经网络模型并加以实现。APC-III聚类算法用于确定RBF神经网络隐含层的中心向量,RLS算法用来调整隐含层与输出层之间的连接权值。RBF神经网络与支持向量机(SVM)和孤立点检测相比,有更高的检测率和较低的误检率,因此,提出的模型具有重要的理论和实用价值。  相似文献   

17.
针对可疑洗钱识别问题,提出了基于交易网络特征向量中心度量的可疑洗钱行为检测系统.检测系统包含交易数据预处理、特征向量中心度量、时序检测分析三个关键子算法.同时还给出了三种用于检测异常交易行为的度量指标.通过对银行交易数据进行的实验仿真,验证了系统的有效性.  相似文献   

18.
针对利用金融机构进行洗钱的犯罪行为,为了提高可疑行为客户的识别效率,智能信息技术与KYC标准的结合为反洗钱工作提供了新的思路。论文将模式识别技术应用于反洗钱领域,提出基于聚类方法的客户交易行为模式识别,通过判断客户交易行为模式,识别具有异常交易行为的可疑客户。实验结果验证了该方法的可行性与有效性。  相似文献   

19.
Money laundering has been affecting the global economy for many years. Large sums of money are laundered every year, posing a threat to the global economy and its security. Money laundering encompasses illegal activities that are used to make illegally acquired funds appear legal and legitimate. This paper aims to provide a comprehensive survey of machine learning algorithms and methods applied to detect suspicious transactions. In particular, solutions of anti-money laundering typologies, link analysis, behavioural modelling, risk scoring, anomaly detection, and geographic capability have been identified and analysed. Key steps of data preparation, data transformation, and data analytics techniques have been discussed; existing machine learning algorithms and methods described in the literature have been categorised, summarised, and compared. Finally, what techniques were lacking or under-addressed in the existing research has been elaborated with the purpose of pinpointing future research directions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号