期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

傅文进吴小俊董文华尹贺峰《模式识别与人工智能》2017,30(3):251-259

针对稀疏子空间聚类(SSC)求得的系数矩阵过于稀疏和最小二乘回归子空间聚类(LSR)求得的系数矩阵过于稠密的问题,文中提出基于协同表示的子空间聚类算法(SCCR).结合SSC和LSR的优点,将l₁范数和Frobenius范数引入同一优化问题中,使系数矩阵保证在同一子空间数据点联系(如LSR)的同时,消除不同子空间数据点之间的联系(如SSC).然后利用此系数矩阵建立相似矩阵,应用谱聚类得到聚类结果.实验表明SCCR可以提高聚类性能. 相似文献

2.

基于概率模型的重叠子空间聚类算法^*

邱云飞费博雯刘大千《模式识别与人工智能》2017,30(7):609-621

针对现有子空间聚类方法处理类簇间存在重叠时聚类准确率较低的问题,文中提出基于概率模型的重叠子空间聚类算法.首先采用混合范数的子空间表示方法将高维数据分割为若干个子空间.然后使用服从指数族分布的概率模型判断子空间内数据的重叠部分,并将数据分配到正确的子空间内,进而得到聚类结果,在参数估计时利用交替最大化方法确定函数最优解.在人造数据集和UCI数据集上的测试实验表明,文中算法具有良好的聚类性能,适用于较大规模的数据集. 相似文献

3.

快速可扩展的子空间聚类算法^*

刘博谢博鋆朱杰景丽萍于剑《模式识别与人工智能》2016,29(1):11-21

子空间聚类算法只能处理小规模数据,且无法处理样本外数据.针对此问题,文中提出采用二次采样策略的子空间聚类框架(TSSC).该框架由两个核心部件组成:判别性协作表示(DCR)与多尺度K近邻(KNN)采样方法.在TSSC中,DCR首先结合多尺度KNN对数据点进行特征变换,从而保证属于同一子空间的点有更一致的表示.为了提高算法的可扩展性,TSSC在新的特征空间中使用多尺度KNN对数据进行二次采样,并根据采样点获得的初步聚类结果训练线性分类器,最后根据学习得到的分类器对剩余样本点进行分类,获得最终的聚类结果.在真实数据集上的实验验证TSSC的有效性. 相似文献

4.

类属型数据核子空间聚类算法

下载免费PDF全文

徐鲲鹏陈黎飞孙浩军王备战《软件学报》2020,31(11):3492-3505

现有的类属型数据子空间聚类方法大多基于特征间相互独立假设,未考虑属性间存在的线性或非线性相关性.提出一种类属型数据核子空间聚类方法.首先引入原作用于连续型数据的核函数将类属型数据投影到核空间,定义了核空间中特征加权的类属型数据相似性度量.其次,基于该度量推导了类属型数据核子空间聚类目标函数,并提出一种高效求解该目标函数的优化方法.最后,定义了一种类属型数据核子空间聚类算法.该算法不仅在非线性空间中考虑了属性间的关系,而且在聚类过程中赋予每个属性衡量其与簇类相关程度的特征权重,实现了类属型属性的嵌入式特征选择.还定义了一个聚类有效性指标,以评价类属型数据聚类结果的质量.在合成数据和实际数据集上的实验结果表明,与现有子空间聚类算法相比,核子空间聚类算法可以发掘类属型属性间的非线性关系,并有效提高了聚类结果的质量. 相似文献

5.

核密度估计的聚类算法^*

朱杰陈黎飞《模式识别与人工智能》2017,30(5):439-447

相似性度量是聚类分析的重要基础,如何有效衡量类属型符号间的相似性是相似性度量的一个难点.文中根据离散符号的核概率密度衡量符号间的相似性,与传统的简单符号匹配及符号频度估计方法不同,该相似性度量在核函数带宽的作用下,不再依赖同一属性上符号间独立性假设.随后建立类属型数据的贝叶斯聚类模型,定义基于似然的类属型对象-簇间相似性度量,给出基于模型的聚类算法.采用留一估计和最大似然估计,提出3种求解方法在聚类过程中动态确定最优的核带宽.实验表明,相比使用特征加权或简单匹配距离的聚类算法,文中算法可以获得更高的聚类精度,估计的核函数带宽在重要特征识别等应用中具有实际意义. 相似文献

6.

基于最小二乘回归的分块加权子空间聚类^*

李辉陈晓云《模式识别与人工智能》2016,29(12):1114-1121

传统子空间聚类算法向量化时忽略样本的自然结构信息,并且容易造成高维度小样本问题,从而导致聚类信息损失.为了弥补该缺陷,文中提出基于最小二乘回归的分块加权子空间聚类(WB-LSR).首先,将样本按维度分成若干块,并求得各个块对应的仿射矩阵.然后,通过相互投票方式对各仿射矩阵设置权重,将加权和作为最终的仿射矩阵.在图像数据和视频数据上的实验表明,文中方法能有效提升聚类准确率. 相似文献

7.

局部约束加强的最小二乘回归子空间聚类^*

赵剑吴小俊董文华《模式识别与人工智能》2017,30(10):943-951

针对最小二乘回归子空间聚类算法存在的数据局部相关性信息缺失、系数矩阵稀疏性不足的缺点,提出局部约束加强的最小二乘回归子空间聚类算法.在原始的最小二乘回归子空间聚类算法的基础上加入数据局部相关性约束,使表示系数矩阵的块对角性质更明显.同时,提出相似度矩阵构造方法,有效提高类内相似度,降低类间相似度.实验表明文中算法可以有效提高聚类的精确度,从而验证算法有效可行. 相似文献

8.

基于二阶近邻的核子空间聚类

王中元刘惊雷《计算机科学》2021,48(6):86-95

高维数据集的处理是计算机视觉领域的核心,子空间聚类是实现高维数据聚类使用最广泛的方法之一.传统的子空间聚类假定数据来自不同的线性子空间,且不同子空间的区域不重叠.然而,现实中的数据往往不满足这两个约束条件,使得子空间聚类的效果受到影响.为了解决这两个问题,引入核化子空间来解决子空间数据的非线性问题,引入子空间系数矩阵的... 相似文献

9.

高维数据聚类方法综述* 总被引：10，自引：2，他引：10

贺玲蔡益朝杨征《计算机应用研究》2010,27(1):23-26

总结了高维数据聚类算法的研究现状,分析比较了算法性能的主要差异,并指出其今后的发展趋势,即在子空间聚类过程中融入其他传统聚类方法的思想,以提高聚类性能。相似文献

10.

基于k最相似聚类的子空间聚类算法 总被引：1，自引：2，他引：1

下载免费PDF全文

单世民闫妍张宪超《计算机工程》2009,35(14):4-6

子空间聚类是聚类研究领域的一个重要分支和研究热点,用于解决高维聚类分析面临的数据稀疏问题。提出一种基于k最相似聚类的子空间聚类算法。该算法使用一种聚类间相似度度量方法保留k最相似聚类,在不同子空间上采用不同局部密度阈值,通过k最相似聚类确定子空间搜索方向。将处理的数据类型扩展到连续型和分类型,可以有效处理高维数据聚类问题。实验结果证明,与CLIQUE和SUBCLU相比,该算法具有更好的聚类效果。相似文献

11.

基于时间序列优化和DTW的在线手写签名鉴别

胡永辉邢延《自动化与信息工程》2011,32(5):40-41,48

针对传统DTW算法的不足,本文通过优化时间序列,提出了基于时间序列优化的在线手写签名鉴别算法。该算法弥补了传统DTW算法忽略签名时间序列长度的不足,并提高了签名认证准确率。实验结果说明算法是可行的。相似文献

12.

基于DTW的多元时间序列模式匹配方法 总被引：1，自引：0，他引：1

李正欣张凤鸣李克武《模式识别与人工智能》2011,24(3):425-430

现有的模式匹配方法难以高效、准确地度量多元时间序列的相似性．本文对多元时间序列进行多维分段拟合,选取各个变量维度上拟合线段的倾斜角和时间跨度作为特征模式,进而提出一种基于DTW的多元时间序列模式匹配方法,并通过实验验证所提方法的有效性．实验结果表明,该模式匹配方法对时间跨度较大且体现一个连续、完整过程的多元时间序列具有较好的匹配效果;对时间跨度较小、体现状态点的多元时间序列也具有一定的匹配能力．相似文献

13.

子空间聚类算法的研究新进展

陈慧萍王煜王建东《计算机仿真》2007,24(3):6-10,34

高维数据聚类是聚类技术的难点和重点,子空间聚类是实现高维数据集聚类的有效途径,它是在高维数据空间中对传统聚类算法的一种扩展,其思想是将搜索局部化在相关维中进行.该文从不同的搜索策略即自顶向下策略和自底向上策略两个方面对子空间聚类算法的思想进行了介绍,对近几年提出的子空间聚类算法作了综述,从算法所需参数、算法对参数的敏感度、算法的可伸缩性以及算法发现聚类的形状等多个方面对典型的子空间聚类算法进行了比较分析,对子空间聚类算法面临的挑战和未来的发展趋势进行了讨论. 相似文献

14.

子空间聚类改进算法研究综述 总被引：1，自引：0，他引：1

李霞徐树维《计算机仿真》2010,27(5):174-177

高维数据聚类是聚类技术的难点和重点,子空间聚类是实现高维数据集聚类的有效途径。CLIQUE算法是最早提出的基于密度和网格的子空间聚类算法,自动子空间聚类算法的实用性和高效性,带来了子空间聚类算法的空前发展。深入分析CLIQUE算法的优点和局限性;介绍了一些近几年提出的子空间聚类算法,并针对CLIQUE算法的局限性作了改进,聚类的效率和精确性得到了提高;最后对子空间聚类算法的发展趋势进行了讨论。相似文献

15.

基于加权动态时间弯曲的多元时间序列相似性匹配方法^*

叶燕清杨克巍姜江葛冰峰豆亚杰《模式识别与人工智能》2017,30(4):314-327

针对常用方法忽略变量相关性和局部形状特性问题,提出基于加权动态时间弯曲的多元时间序列相似性匹配方法(CPCA-SWDTW).首先,在原加权动态时间弯曲算法基础上,引入形态因子,提出基于形态特征的加权动态时间弯曲算法(SWDTW).然后,提取多元时间序列的主成分作为模式表示,消除变量间的相关性,同时将方差贡献率作为相应主成分的权重.在此基础上,运用SWDTW,度量多元时间序列间的相似度.最后,通过相似性搜索实验表明,CPCA-SWDTW具有较好的准确性和鲁棒性.敏感性分析说明CPCA-SWDTW在一定程度上受到权重函数参数的影响. 相似文献

16.

联合l_p/l_2,p范数极小化的序列子空间聚类算法

胡文玉李声豪涂志辉易云《模式识别与人工智能》2020,33(3):221-233

为了有效挖掘序列数据的时空信息,提出联合l_p和l_2,p范数极小化的序列子空间聚类算法.首先,定义依赖于样本距离的权重,构造基于l_2,p范数的时序图,刻画数据在时间维度上的局部相似性.然后,考虑到非凸l_p0l₁范数,能更有效地切断语义无关数据间的联系,所以采用l_p范数度量表示矩阵的稀疏性.最后,通过线性化交替方向法求解优化模型.在视频、运动、人脸数据上的实验表明文中算法的有效性. 相似文献

17.

基于特殊点的DTW在线手写签名认证算法

栾方军李开徐慧红《现代计算机》2008,(11)

针对传统动态时间规正算法速度较慢的缺点,提出基于特殊点的动态时间规正在线手写签名认证算法.特殊点包含了丰富的签名信息,表现了签名者的基本生物特征.该算法缩短了身份认证的时间,提高了身份认证的效率.实验结果表明,该方法速度快、识别率高,进而证明在线手写签名在身份认证中具有很好的应用前景. 相似文献

18.

局部加权最小二乘回归的重叠子空间聚类算法

邱云飞费博雯刘大千《模式识别与人工智能》2018,31(2):114-122

针对大多数子空间聚类方法处理非线性数据时聚类效果不理想、不同子空间数据相似性较高及聚类发生错误时无法及时校验的问题,提出局部加权最小二乘回归的重叠子空间聚类算法.利用K近邻思想突出数据的局部信息,取代非线性数据结构,通过高斯加权的方法选择最相似的近邻数据点,得到最优表示系数.然后使用重叠概率模型判断子空间内数据的重叠部分,再次校验聚类结果,提高聚类准确率.在人造数据集和真实数据集上分别进行测试,实验表明,文中算法能够取得较理想的聚类结果. 相似文献

19.

能量模型数据挖掘的研究

王飞《软件》2011,32(1):32-34

本文通过数据挖掘自身的特点,有效地结合相关算法并基于人体运动捕捉数据,给出这两个问题的有效解决方法。主要工作如下：（1）提出了基于能量模型的算法。相对于现有文献中使用的关节的几何位置,本文提出了的人体能量模型能够有效地降低动作数据的维度,并且能够正确地反映原动作的特征。在此基础上,使用相关系数来表示人体运动过程中各关节之间的相关性,并据此提取出原动作的低维度索引,实验表明该索引能够有效地体现原动作的特征。使用支持向量机结合低维度索引可以有效地讲输入动作划分到一个动作大类中,在此基础上使用基于Keogh下界的线性索引算法可以精确、快速地检索到与输入动作DTW距离最近的候选动作。（2）提出了基于公共子序列距离的数据挖掘算法。相对于现有文献中使用的欧式距离,本文使用的基于最长公共子序列的度量方法能够有效地降低噪声对于挖掘结果的不利影响。使用启发式搜索可以将搜索所需要的时间降低为使用朴素式搜索算法的60%以下,并且随着序列的长度的增加、计算量的增大,前者相对于后者运行时间的百分比有明显的减小趋势,利用这一特性,该算法可以在长序列的主旨模式挖掘中,大规模地减少算法的运行时间。在各长度的候选模式集合中,使用层次化聚类分析可以有效地合并相似度较高的候选模式,以达到合理约简模式、消除相邻重叠模式对结果不利影响的目的。使用最小描述长度原则可以根据模式的长度以及出现频率对候选模式表达整个原序列的能力进行有效地评估,从而达到支持非固定长度主旨模式挖掘的目的。相似文献