期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于自适应阈值的自动提取关键帧的聚类算法 总被引：15，自引：0，他引：15

王方石须德吴伟鑫《计算机研究与发展》2005,42(10):1752-1757

利用无监督聚类算法来提取关键帧是一种常用的方法,但该算法对类别数和初始类划分较敏感,在对视频内容一无所知的情况下,要求预先指定聚类数目是一个很困难的问题．提出一种二次聚类的方法;第1次以镜头内相邻两帧的相似度为数据样本进行聚类（分成两类）,计算确定第2次聚类所需的阈值;第2次采用动态聚类的ISODATA算法,以视频序列的帧为数据样本进行聚类,得到最终聚类结果．最后在每类中自动提取距其类中心最近的帧为关键帧．该算法简单且行之有效,无需预定义任何阈值（如聚类数目）．对大量不同特点的视频进行了实验,该算法均取得了较好的实验结果．相似文献

2.

一种基于近邻传播算法的最佳聚类数确定方法 总被引：2，自引：0，他引：2

周世兵徐振源唐旭清《控制与决策》2011,26(8):1147-1152

在聚类分析中,决定聚类质量的关键是确定最佳聚类数,对此,从样本几何结构的角度定义了样本聚类距离和样本聚类离差距离,设计了一种新的聚类有效性指标．在此基础上,提出一种基于近邻传播算法确定样本最佳聚类数的方法．理论研究和实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合于确定样本的最佳聚类数．相似文献

3.

多层反馈神经网络的FP学习和综合算法 总被引：19，自引：1，他引：19

张铃张钹《软件学报》1997,8(4):252-258

本文给出多层反馈神经网络的ＦＰ学习和综合算法，并讨论此类网络的性质，指出将它应用于聚类分析能给出不粒度的聚类，且具有收敛速度快（是样本个数的线性函数）、算法计算量少（是样本个数和输入、输出维数的双线性函数）、网络元件个数少、权系数简单（只取３个值）、网络容易硬件实现等优点．作为聚类器的神经网络的学习和综合问题已得到较圆满地解决. 相似文献

4.

基于ANFIS的污水处理过程建模的研究 总被引：1，自引：0，他引：1

余颖乔俊飞《计算机工程》2006,32(8):266-268,277

针对活性污泥法污水处理过程的特点，提出了一种基于ANFIS的建模方法。以污水处理厂水质数据为样本，首先利用主元分析（PCA）实现输入变量的降维和去相关，随后采用减法聚类算法生成初始模糊推理系统，进而采用ANFIS建立活性污泥法污水处理过程模型。仿真实验表明：基于ANFIS的建模方法是有效的；通过仿真结果比较，PCA-减法聚类-ANFIS网络的拟合能力及收敛速度均优于PCA—BP，更适合作为活性污泥法污水处理过程模型。相似文献

5.

基于改进聚类分析算法的入侵检测系统研究

下载免费PDF全文

杜强孙敏《计算机工程与应用》2011,47(11):106-108

针对常用聚类分析算法应用于入侵检测系统所存在的两大方面的问题：一是其采用随机法确定初始聚类中心,不同的初始值可能产生不同的聚类结果;二是采用爬山式技术导致容易陷入局部最优解。基于此提出一种改进的聚类分析算法,通过确定两个最远初始聚类中心和基于最大最小距离的层次聚类、DBI指标来确定剩余初始聚类中心,该方法使上述问题得到解决,并通过仿真实验验证了该算法的可行性和优越性。相似文献

6.

基于聚类的商业营销数据分析及应用

张宏翔《数字社区&智能家居》2013,(16):3853-3855

系统聚类法是聚类分析中应用最广泛的一种方法,凡是具有系统聚类分析数值特征的变量和样品都可以采用系统聚类法,选择不同的距离和聚类方法可获得满意的数值分类效果。该文将应用系统聚类法通过客户数据对银行营销进行分析,分类的目的是银行的客户群进行分类。相似文献

7.

基于高斯混合聚类采样的不平衡数据处理方法

严涛江开忠姜新盈王舒梵《计算机应用与软件》2023,(12):305-311

在处理不平衡数据时，为有效剔除多数样本内的冗余信息和合成有价值的少数样本，提出一种基于高斯混合模型的采样算法(MSGMM)。将多数类和少数类样本分别聚类，最佳聚类个数通过迭代确定。在迭代时，先初步选择聚类个数并用高斯混合模型聚类。对于多数样本的每一个聚类C的剔除比例为其聚类中心到SVM生成超平面的距离权重和其数量权重的加权；对少数类样本按聚类中心到超平面的距离来划分采样比例；并用Random-SMOTE算法合成新样本，以此达到样本数量之间的平衡。实验表明该算法相较于传统算法，精度有1%～16%的提升，验证了该算法的有效性。相似文献

8.

基于测量报告信号聚类的指纹定位方法

张海永方贤进张恩皖李宝玉彭超穆健翔《计算机应用》2023,(12):3947-3954

针对基于加权K最近邻（WKNN）和机器学习算法的指纹库定位方法存在精度和定位效率较低的问题，提出一种基于测量报告（MR）信号聚类的指纹定位方法。首先，把MR信号分为室内、道路和室外这3种属性；其次，利用地理信息系统（GIS）信息将栅格分为建筑物、道路和室外子区域，并将不同属性的MR数据落入对应的属性子区域；最后，借助K均值（K-Means）聚类算法对栅格内的MR信号进行聚类分析，以创建子区域下的虚拟子区域，并采用WKNN算法对MR测试样本进行匹配。此外，利用欧氏距离计算平均定位精度，并通过生产环境的一些MR数据测试了所提方法的定位性能。实验结果表明，所提方法的50 m定位误差占比为71.21%，相较于WKNN算法提升了2.64个百分点；平均定位定位误差为44.73 m，相较于WKNN算法降低了7.60 m。所提方法具备良好的定位精度和效率，可满足生产环境中MR数据的定位需求。相似文献

9.

一种基于三角模糊数多指标信息的FCM 聚类算法 总被引：2，自引：2，他引：2

樊治平于春海尤天慧《控制与决策》2004,19(12):1407-1411

针对一类具有不确定性三角模糊数多指标信息的聚类分析问题，基于传统的数值信息FCM聚类算法，提出一种新的聚类分析算法．首先描述了具有三角模糊数多指标信息的聚类分析问题，提出并证明了基于三角模糊数多指标信息的关于最优划分和最优聚类中心确定的两个定理；然后根据这两个定理，进一步给出了基于三角模糊数信息的FCM聚类算法的迭代步骤；最后通过一个算例说明了该聚类算法的具体应用．相似文献

10.

聚类混合型数据的密度峰值改进算法

下载免费PDF全文

谭阳唐德权曹守富《计算机工程与应用》2020,56(12):47-53

聚类混合型数据，通常是依据样本属性类别的不同分别进行评价。但这种将样本属性划分到不同子空间中分别度量的方式，割裂了样本属性原有的统一性；导致对样本个体的相似性评价产生了非一致的度量偏差。针对这一问题，提出以二进制编码样本属性，再由海明差异对属性编码施行统一度量的新的聚类算法。新算法通过在统一的框架内对混合型数据实施相似性度量，避免了对样本属性的切割，在此基础上又根据不同属性的性质赋予其不同的权重，并以此评价样本个体之间的相似程度。实验结果表明，新算法能够有效地聚类混合型数据；与已有的其他聚类算法相比较，表现出更好的聚类准确率及稳定性。相似文献

11.

基于近邻传播算法的最佳聚类数确定方法比较研究 总被引：2，自引：0，他引：2

周世兵徐振源唐旭清《计算机科学》2011,38(2):225-228

在聚类分析中,决定聚类质量的关键是确定最佳聚类数.提出采用聚类效果较好的近邻传播聚类算法对样本进行聚类,运用6种聚类有效性指标分别对聚类结果进行有效性分析,以确定最佳聚类数.具体分析了这些有效性指标,并改进了IGP指标确定最佳聚类数的方法.针对8个数据集,通过实验比较这些指标的性能.分析和实验结果表明,基于近邻传播聚类... 相似文献

12.

最小生成树用于基因表示数据的聚类算法 总被引：6，自引：0，他引：6

杨国慧周春光黄艳新吕慧英《计算机研究与发展》2003,40(10):1431-1435

在生物学研究中，需要对植物和动物分类，对基因进行分类，以获得对种群固有结构的认识．使用聚类分析方法，有效地鉴别基因表示数据的模式，将它们分组成为由类似对象组成的多个类，对研究基因的结构、功能以及不同种类基因之间的关系都具有重要意义．将图论的最小生成树理论引入分子生物学中基因表示数据的聚类分析方法，设计了生成树的表示和基于最小生成树的聚类算法，证明了该方法对于一些准则函数能够产生全局最优簇，并根据实验结果对算法进行了讨论和评价．相似文献

13.

基于K-means和PCA的银行客户数据研究

张克强刘静超《现代计算机》2023,(22):60-63

根据银行的业务客户样本,通过K-means方法对群体进行聚类分析,从而发现不同客户群体的特征和行为习惯,为银行的业务决策提供依据。在具体实现过程中,首先需要进行数据预处理和特征工程,包括数据清洗、缺失值填充、特征选择等。使用轮廓系数法确定最优聚类数目,对预处理后的样本进行K-means聚类分析,再使用主成分分析法（PCA）进行数据降维,对结果进行可视化展示,从而更加清晰地了解不同客户群体的特征和行为习惯。相似文献

14.

基于模糊谱聚类的不确定蛋白质相互作用网络功能模块挖掘

毛伊敏刘银萍梁田毛丁慧《计算机应用》2019,39(4):1032-1040

针对谱聚类融合模糊C-means（FCM）聚类的蛋白质相互作用（PPI）网络功能模块挖掘方法准确率不高、执行效率较低和易受假阳性影响的问题，提出一种基于模糊谱聚类的不确定PPI网络功能模块挖掘（FSC-FM）方法。首先，构建一个不确定PPI网络模型，使用边聚集系数给每一条蛋白质交互作用赋予一个存在概率测度，克服假阳性对实验结果的影响；第二，利用基于边聚集系数流行距离（FEC）策略改进谱聚类中的相似度计算，解决谱聚类算法对尺度参数敏感的问题，进而利用谱聚类算法对不确定PPI网络数据进行预处理，降低数据的维数，提高聚类的准确率；第三，设计基于密度的概率中心选取策略（DPCS）解决模糊C-means算法对初始聚类中心和聚类数目敏感的问题，并对预处理后的PPI数据进行FCM聚类，提高聚类的执行效率以及灵敏度；最后，采用改进的边期望稠密度（EED）对挖掘出的蛋白质功能模块进行过滤。在酵母菌DIP数据集上运行各个算法可知，FSC-FM与基于不确定图模型的检测蛋白质复合物（DCU）算法相比，F-measure值提高了27.92%，执行效率提高了27.92%；与在动态蛋白质相互作用网络中识别复合物的方法（CDUN）、演化算法（EA）、医学基因或蛋白质预测算法（MGPPA）相比也有更高的F-measure值和执行效率。实验结果表明，在不确定PPI网络中，FSC-FM适合用于功能模块的挖掘。相似文献

15.

基于改进型模糊聚类的模糊系统建模方法 总被引：9，自引：1，他引：8

朱喜林武星星李晓梅《控制与决策》2007,22(1):73-77

结合减法聚类和模糊C均值聚类,提出了一种改进型聚类算法,加快了收敛速度．利用改进后的算法对模糊系统输入或输出的样本集聚类,对聚类结果采用Trust-Region法拟合高斯型和S型函数,以实现模糊系统输入、输出空间的划分和隶属度函数参数的确定．结合MATLAB的模糊和曲线拟合工具箱,详述了如何在标准算法上进行改进和模糊系统建模．通过对IRIS标准数据聚类实验以及在解决机械加工误差复映问题上的应用,验证了改进后算法和建模方法的有效性．相似文献

16.

自适应图融合的缺失多视图聚类算法

黄展鹏吴杰康易法令《计算机工程与应用》2023,(9):176-181

多视图聚类能充分利用不同视图间数据的一致性和差异性,引起越来越多的关注。传统多视图聚类方法假设每个视图的数据都是完整的,然而在实际应用中,收集到的多视图数据常存在部分视图缺失的样本。为了对缺失多视图数据进行聚类分析,提出自适应图融合的缺失多视图聚类算法（IMC＿AGF）。算法以两两视图间共有样本为瞄点构建样本-样本的相似度矩阵,学习其一致性知识,再利用两两视图间的互补性,用自适应图融合算法整合所有的相似度图,获取缺失多视图数据完整的相似度矩阵,然后进行谱聚类得到分类结果。实验结果表明,提出的算法优于与之比较的经典缺失多视图聚类方法。相似文献

17.

两种聚类算法的比较与实现

周莹《电脑编程技巧与维护》2013,(8):28-30

基于统计的系统聚类分析是一种重要的数据挖掘算法。研究了一种多重系统聚类模型及其算法实现,把变量聚类和样本聚类相结合,并使用了两种方法赋值样本数据阵,使聚类结果更加直观。相似文献

18.

改善BP网络用于建立FCC产品收率预测模型过程中稀疏样本的训练或检验效果的研究

何小荣张春良陈丙珍赵建华徐红喜《计算机与应用化学》1997,(2)

讨对BP（Back-propagation）人工神经网络用于FCC（Fluidcatalyticcracking）产品收率预测建模时稀疏点样本吻合性较差的问题，提出了①先对样本在空间用聚类分析法进行定位，确定那些是稀疏点、孤点和病点；②孤点用于训练；③剔除病点；④加大稀疏点对目标函数的权重改善稀疏点样本的吻合性，提高了模型的适应性和精度。相似文献

19.

改善BP网络用于建立FCC产品收率预测模型过程中稀疏样本…

何小荣赵建华《计算机与应用化学》1997,14(2):101-104

针对ＢＰ人工神经网络用于ＦＣＣ产品收收率预测模时稀疏点吻合性较差的问题，提出了（１）先对样本在空间用聚类地进行定位，确定那些是稀疏点、孤和病点；（２）弧点用于训练；（３）剔除病点；（４）加大稀疏点对目标函的权重改善稀疏点样本的吻合性，提高了模型的适应性和精度。相似文献

20.

基于医疗文本数据聚类的帕金森病早期诊断预测

张晓博杨燕李天瑞陆凡彭莉兰《计算机应用》2005,40(10):3088-3094

针对多发于老龄人群的帕金森病（PD）的早期智能化诊断的问题，提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先，对原始数据集进行预处理以获取有效特征信息，并通过主成分分析（PCA）方法将原始特征分别降维到8个不同维度的维度空间；然后，应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类；最后，采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失（SWEDD） PD患者。仿真结果显示，PCA特征维度值取30时，高斯混合模型（GMM）的聚类准确度达到89.12%；PCA特征维度值取70时，谱聚类（SC）的聚类准确度达到61.41%；PCA特征维度值取80时，元聚类算法（MCLA）的聚类准确度达到59.62%。对比实验结果表明，5种经典聚类方法中，PCA的特征维度值小于40时，高斯混合模型聚类效果最佳；3种聚类集成方法中，对于不同的特征维度，MCLA的聚类性能均表现优异，进而为PD的早期智能化辅助诊断提供了技术和理论支撑。相似文献