首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
针对基于基因表达式编程(GEP)的自动聚类算法GEP-Cluster中聚类中心的筛选和聚合、计算数据对象到各聚类中心距离两个关键步骤效率不高的问题,提出了一种基于统一计算设备架构(CUDA)和GEP的自动聚类改进算法(CGEP-Cluster)。CGEP-Cluster算法采用基因阅读运算器方法对GEP-Cluster算法的聚类中心筛选和聚合步骤进行改进,并基于CUDA将GEP-Cluster算法中数据对象到各聚类中心距离的计算并行化。实验结果表明,在数据对象规模较大时,CGEP-Cluster算法可获得8倍左右的加速比。CGEP-Cluster算法可用于聚类数未知且数据对象规模较大情况下的自动聚类。  相似文献   

2.
聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类(簇)的过程。同一个簇中的对象彼此相似,而不同簇中的对象差异较大。以基因表达式编程算法为基础,结合新设计的广义聚类代数算子和目标优化函数,提出一种基于基因表达式编程的多目标自动聚类算法(MAGEP-Cluster)。该算法不仅可以自动确定最优聚类的数目,还可以同时基于簇内数据紧凑性和簇间数据连通性两个指标实现数据的有效划分。在三个人工数据集和五个UCI数据集上的实验结果表明,与GEP-Cluster、MOCK和VAMOSA等算法相比,MAGEP-Cluster具备更好的聚类性能。  相似文献   

3.
针对现有地理信息数据分类不能体现数据归属的多类别共存性问题,提出一种使用聚类和并行计算技术提高数据分类的有效性和效率的并行地理信息数据聚类算法,并实现相应的数据自动分类系统。采用文本向量建模和抽取数据的类别特征,然后采用基于GPU的并行k-means聚类算法对数据进行类别划分。实验表明,设计的并行聚类算法体现了特征属性归属的多类别交叉性,具有较好的运行性能和扩展性。  相似文献   

4.
吴斌  卢红丽  江惠君 《计算机应用》2020,40(6):1654-1661
密度峰值聚类(DPC)算法是一种新型的聚类算法,具有调节参数少、无需迭代求解、能够发现非球形簇等优点;但也存在截断距离无法自动调节、聚类中心需要人工指定等缺点。针对上述问题,提出了一种自适应DPC(ADPC)算法,实现了基于基尼系数的自适应截断距离调节,并建立了一种聚类中心的自动获取策略。首先,综合考虑局部密度和相对距离两种因素以重新定义簇中心权值计算公式;然后,基于基尼系数建立自适应截断距离调节方法;最后,根据决策图和簇中心权值排序图提出自动选取聚类中心的策略。仿真实验结果表明,ADPC算法可以根据问题特征来自动调节截断距离并自动获取聚类中心点,而且在测试数据集上取得了比几种常用的聚类算法和DPC改进算法更好的结果。  相似文献   

5.
基因表达式编程(Gene Expression Programming, GEP)是一种计算量大且通用性强的新型进化算法,其传统计算形式不能充分利用目前主流的多核处理器。为提高算法效率,提出了基于通用多核处理器平台的并行基因表达式编程算法(Parallel Gene Expression Programming Based on General Multi-core Processor, PGEP-MP)。主要工作包括:O)分析通用多核处理器平台下并行基因表达式编程算法的机理;(2)利用MPI和()pcnMP混合编程模型设计基于通用多核处理器平台的基因表达式编程算法的粗粒度与细粒度相结合的并行模型;(3)提出改进PEEP-MP算法效率的进化策略;(4)通过对函数挖掘和分类的实验证明,PEEP-Ml〕算法提高了函数挖掘和分类的效率,在并行双核处理器数为4的情况下,PEEP-MP的平均并行加速比分别是传统GEP算法的4. 22倍和 4. 06倍。  相似文献   

6.
一种有效的用于数据挖掘的动态概念聚类算法   总被引:11,自引:0,他引:11  
郭建生  赵奕  施鹏飞 《软件学报》2001,12(4):582-591
概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务.定义了一种基于语义的距离判定函数,结合领域知识对连续属性值进行概念化处理,对于用分类属性和数值属性混合描述数据对象的情况,提出了一种动态概念聚类算法DDCA(domain-baseddynamicclusteringalgorithm).该算法能够自动确定聚类数目,依据聚类内部属性值的频繁程度修正聚类中心,通过概念归纳处理,用概念合取表达式解释聚类输出.研究表明,基于语义距离判定函数和基于领域知识的动态概念聚类的算法DDCA是有效的.  相似文献   

7.
事件抽取是自动内容抽取(Automatic Content Extraction,ACE)会议评测的任务之一,事件要素识别是事件抽取的一个子任务。分析了事件抽取和事件要素识别的研究现状,提出了一种基于特征加权的事件要素识别算法(Feature Weighting Based Event Argument Identification,FWEAI)。该算法首先对分类算法中的ReliefF特征选择算法进行改进,将其应用于聚类算法中。改进的ReliefF算法(FWA)根据各个特征对聚类的不同贡献分配不同的权值,然后采用KMeans算法对事件要素进行聚类。实验结果表明,FWEAI算法可以提高事件要素识别的准确率。  相似文献   

8.
本文参照在自动分类问题中一种常见的基于Kullback-Leibler距离的特征聚类算法,针对其特征压缩造成的性能损失而导致分类性能下降的问题提出了改进,结合模糊数学的思想,提出了一种基于特征模糊相关的特征聚类算法FFC,最后在本文的一个应用系统AGENT上给出实验数据,并比较了两种算法的差异.  相似文献   

9.
基于GEP和神经网络的属性约简分类算法   总被引:2,自引:0,他引:2  
分类(Classification)是数据挖掘(DataMining)中的一个重要研究方向,目前传统的方法有神经网络,Fisher判别法等。神经网络缺乏对分类结果的直观解释;Fisher判别对于大数据集分类准确率大大下降,且不具有属性约简能力。为此,该文做了如下工作(1)提出了自动获取最佳阈值的思想;(2)对于错分的实例,提出了运用神经网络分类器二次分类的思想;(3)提出了基于基因表达式编程和神经网络的属性约简分类算法(AttributionReductionClassificationAlgo-rithmsBasedonGEPandNeuralNetwork,ARCA-GEPNN);(4)实验表明,ARCA-GEPNN的分类精度比Fisher判别提高了约25%,比GEP提高了约21%。  相似文献   

10.
分析了目前基于目标函数聚类算法的不足,面对形状复杂且非重叠的样本聚类问题,定义了最邻近距离和生长树的概念。随机选取生长树初始种子点,以最邻近距离作为生长树生长的方向和样本划分依据,以最终生长树大小为聚类目标函数,引入遗传算法,提出基于生长树的遗传聚类算法,并通过实例进行了算法测试和比较。算法测试表明:基于生长树的遗传聚类算法对于形状复杂且非重叠样本的聚类是完全可行和有效的。  相似文献   

11.
张倩  丁友东  蓝建梁  涂意 《计算机工程》2011,37(11):212-214,217
针对人脸特征分类问题,提出一种基于主动形状模型(ASM)和K近邻算法的人脸脸型分类方法。将Hausdorff距离作为K近邻算法的距离函数,利用ASM算法提取待测图像的特征点,对点集进行归一化后计算人脸轮廓特征点与样本库中所有样本点集的Hausdorff距离,根据该距离值,通过K近邻算法实现待测图像的脸型分类。实验结果证明,该方法分类正确率高、速度快、易于实现。  相似文献   

12.
使用PCA降维,提取人脸表情特征,并结合基于距离的哈希K近邻分类算法进行人脸表情识别。首先使用类Haar特征和AdaBoost算法进行人脸检测,并对人脸图像进行预处理;接着使用PCA提取人脸表情特征,并将特征加入到哈希表;最后使用K近邻分类算法进行人脸表情的识别。将特征库重构为哈希表后,很大地提高了识别效率。  相似文献   

13.
针对心电信号(Electrocardiogram,ECG)的情感识别问题,将局部搜索策略和变异引入蚁群系统(Ant Colony System,ACS)用于特征选择;用K近邻法对高兴和悲伤两种情感分类,在获得较高的识别率和有效特征组合的同时,提高了收敛速度,最好识别率达到93.64%。实验仿真结果表明,该方法是行之有效的。  相似文献   

14.
经典模糊C均值聚类算法(FCM)基于欧氏距离,存在不同规模类簇不能正确聚类问题,针对此问题提出一种基于[K]近邻隶属度的模糊C均值聚类算法(KNN_FCM)。讨论了基于[K]近邻隶属度的粗糙C均值聚类算法(KNN_RCM)和粗糙模糊C均值聚类算法(KNN_RFCM),此方法避免了传统粗糙C均值聚类算法(RCM)和粗糙模糊C均值聚类算法(RFCM)中阈值选择问题。将KNN_FCM、KNN_RCM、KNN_RFCM分别与FCM、RFM、RFCM在UCI数据集上进行仿真比较,结果表明新方法是可行、有效的。  相似文献   

15.
葛倩  张光斌  张小凤 《计算机应用》2022,42(10):3046-3053
为解决特征选择ReliefF算法在利用欧氏距离选取近邻样本过程中,算法稳定性差以及选取的特征子集分类准确率低的问题,提出了一种利用最大信息系数(MIC)作为近邻样本选择标准的MICReliefF算法;同时,以支持向量机(SVM)模型的分类准确率作为评价指标,并多次寻优,以自动确定其最优特征子集,从而实现MICReliefF算法与分类模型的交互优化,即MICReliefF-SVM自动特征选择算法。在多个UCI公开数据集上对MICReliefF-SVM算法的性能进行了验证。实验结果表明,MICReliefF-SVM自动特征选择算法不仅可以筛除更多的冗余特征,而且可以选择出具有良好稳定性和泛化能力的特征子集。与随机森林(RF)、最大相关最小冗余(mRMR)、相关性特征选择(CFS)等经典的特征选择算法相比,MICReliefF-SVM算法具有更高的分类准确率。  相似文献   

16.
刘美茹 《计算机工程》2007,33(15):217-219
文本分类技术是文本数据挖掘的基础和核心,是基于自然语言处理技术和机器学习算法的一个具体应用。特征选择和分类算法是文本分类中两个最关键的技术,该文提出了利用潜在语义索引进行特征提取和降维,并结合支持向量机(SVM)算法进行多类分类,实验结果显示与向量空间模型(VSM)结合SVM方法和LSI结合K近邻(KNN)方法相比,取得了更好的效果,在文本类别数较少、类别划分比较清晰的情况下可以达到实用效果。  相似文献   

17.
郑盼丽  戴牡红 《计算机系统应用》2012,21(11):218-221,193
研究了一种基于文法引导遗传编程(GGP)的自动数据挖掘算法.规则归纳算法是一种典型的数据分类方法.采用文法引导的遗传编程对规则归纳算法进行改进,从而提出了一种规则自动提取的算法.最后结合电视购物项目,给出了基于文法引导的遗传编程自动提取规则的实例.  相似文献   

18.
针对人工排矸法、机械湿选法、γ射线分选法等传统煤矸石分选方法无法兼顾快速高效性、安全无害性、简单操作性的问题,提出了基于机器视觉的煤矸石图像分类方法。对煤矸石图像进行增强、平滑去噪等预处理,采用基于距离变换的分水岭算法实现煤矸石图像分割提取。针对煤矸石分割图像,选取煤矸石图像的HOG特征及灰度共生矩阵,分别以支持向量机、随机森林、K近邻算法作为分类器进行基于特征提取的煤矸石分类识别;分别建立浅层卷积神经网络和基于ImageNet数据集预训练的VGG16网络,进行基于卷积神经网络的煤矸石分类识别。研究结果表明,基于VGG16网络的煤矸石图像分类方法准确率最高为99.7%,高于基于特征提取方法的91.9%和基于浅层卷积神经网络方法的92.5%。  相似文献   

19.
从相关向量机(RVM)和支持向量机(SVM)的相似性以及RVM的稀疏特性出发,将RVM应用于脑电信号(EEG)的情感识别中。针对一对一(OAO)和一对多(OAA)两种多分类方法各自的特点和不足,提出了一种全新的两层多分类模型(OAA-OAO),改进现有OAO算法中无效投票影响最终决策的现象。设计情感EEG信号识别对比实验,验证基于RVM的改进多分类算法在脑电信号情感识别中的应用。对于实验室采集的情感脑电信号,提取其非线性特征(功率谱熵、样本熵和Hurst指数)并采用主成分分析法进行降维。将OAA-OAO-RVM算法分别和OAO-SVM、OAO-RVM两种识别网络进行对比,分析RVM的识别性能以及OAA-OAO多分类算法的分类性能。结果表明,采用降维后的最优特征集合作为识别网络的输入向量得到的识别性能更高,且RVM表现出的性能优于SVM。同时,改进后的OAA-OAO算法较传统OAO模型的平均识别率提高了7.89%,证明OAA-OAO算法可有效去除一部分无效投票从而使分类精度得到显著提高,验证了此模型是一种有效的多分类模型。  相似文献   

20.
针对局部二值模式没有考虑邻域点之间的关系以及局部序数模式(LIOP)的邻域点数过少不足,提出一种利用大邻域范围内邻域点间序数信息的特征提取算法。该算法首先以类似LIOP编码的方式得到的邻域特征向量,然后应用[k]均值聚类算法降低特征向量的主模数量。同时此聚类过程可以离线进行并且运行十分高效;最终将级联直方图特征作为人脸特征向量。实验结果表明,该方法的鲁棒性和识别率均优于对比算法。最后应用WPCA算法既降低特征维数又提升了算法的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号