共查询到19条相似文献,搜索用时 375 毫秒
1.
提出一种新的图聚类算法,结合结点的结构及属性特性,使用统一的随机移动距离计算结点间的相似度,在邻接随机移动距离矩阵的基础上进行聚类.实验结果表明,基于属性扩展图的聚类算法在图拓扑结构的基础上,充分考虑了各个结点所拥有的属性特点,得到的聚类结果将更好的切合实际的应用. 相似文献
2.
模糊C均值(FCM)聚类算法及其相关改进算法基于最大模糊隶属度原则确定聚类结果,没有充分利用迭代后的模糊隶属度矩阵和簇类中心的样本属性特征信息,影响聚类准确度。针对这个问题,该文提出一种新的改进思路:改进FCM算法输出定类原则。给出二元属性拓扑子空间中属性相似度的定义,最终提出一种基于属性空间相似性的改进FCM算法(FCM-SAS):首先,选择FCM算法聚类后模糊隶属度低于聚类置信度的样本作为存疑样本;然后,计算存疑样本与聚类后聚类中心的属性相似度;最后,基于最大属性相似度原则更新存疑样本的簇类标签。通过UCI数据集实验,证明算法不仅有效,还较一些基于最大模糊隶属度原则定类的改进算法具有更优的聚类评价指标。 相似文献
3.
在传统的K-means聚类算法基础上提出了一种基于均方差属性加权的MWS-K-means算法.引入特征权重以提高聚类结果的类内相似度(intra-similarities),从而提高聚类精度.考虑到K-means算法采用误差平方和作为聚类准则函数, 而误差平方和与概率论中数字特征的基本描述方法--均方差具有较高相似性,算法中特征权重的计算采用均方差法.根据属性的离散程度对欧氏距离进行加权处理,从而用相对距离代替绝对距离来计算类间相似度.实验结果表明:MWS-K-means算法在聚类精度方面优于标准的K-means算法. 相似文献
4.
该文提出了一种基于先验知识的三音子模型聚类结构自适应策略,可以在规模很小的自适应语音库条件下改善三音子声学模型的聚类结构使之更适合应用对象的协同发音特点。以基本声学模型训练过程中的三音子模型聚类结果作为先验知识的聚类中心,依据基本声学模型对自适应语音库的分割,按照最大似然准则迭代地重估新的聚类中心和模型聚类结构。实验表明:基于先验知识的三音子模型聚类结构自适应策略可以在不足两小时的自适应语音库上实现三音子模型聚类结构重估,在针对汉语母语说话人的英语声学模型实验中,该文的模型聚类结构自适应策略可以将系统识别率从74.59%提高到83.63%。 相似文献
5.
基于分类特征空间高斯混合模型和神经网络融合的说话人识别 总被引:2,自引:0,他引:2
该文提出了一种基于分类高斯混合模型和神经网络融合(FS-GMM/NN)的说话人识别方法,通过对特征矢量进行聚类分析,将说话人的训练语音分成若干类。然后根据各个类中含特征矢量的多少采用不同的模型混合度,训练建立分类高斯混合模型。并采用神经网络实现各个分类高斯混合模型输出的融合。在100个男性话者的与文本无关的说话人识别实验中,基于分类高斯混合模型和神经网络融合的方法在识别性能及噪声鲁棒性上都优于不分类的GMM识别系统,并具有较高的模型训练效率,且可以有效地降低话者模型的混合度和测试语音长度。 相似文献
6.
7.
基于特征元素和关联规则的图象分类方法 总被引:3,自引:0,他引:3
图象分类是搜索引擎中的重要模块.本文提出了一种基于特征元素的图象分类方法.特征元素与特征向量相比能够根据人的主观感知来提取图象的视觉特征.与传统的基于特征向量的图象分类方法不同,本文提出的图象分类方法不计算特征空间中特征向量之间的距离,而是通过关联规则挖掘发现图象的特征元素与图象所属类别之间的联系.本文实现了该分类算法并将其与一种基于特征向量的图象分类方法NFL相比较.实验的结果证实了所提方法的优越性. 相似文献
8.
提出一种基于子空间特征向量的三维点云相似性分析算法。首先,获取两个物体的三维点云数据,并进行位置标准化。其次,利用最小子空间分割算法将两个三维点云分别分割成若干子空间。随后,计算子空间的质心到其拟合曲面的距离和夹角,并基于上述距离和夹角构成的向量空间,提取子空间特征向量。最后,通过特征向量间的相似度计算来评价两个三维点云的相似性。由于该方法将描述三维形体特征的子空间特征向量作为相似度度量的依据,所以具有数据量小、精度高的特点。实验表明,该算法能够定量地分析两个三维物体的相似性。 相似文献
9.
10.
11.
12.
13.
The authors applied a scale-space clustering algorithm to the classification of a multispectral and polarimetric SAR image of an agricultural site. After the initial polarimetric and radiometric calibration and noise cancellation, a 12-dimensional feature vector for each pixel was extracted from the scattering matrix. The clustering algorithm partitioned a set of unlabeled feature vectors from 13 selected sites, each site corresponding to a distinct crop, into 13 clusters without any supervision. The cluster parameters were then used to classify the whole image. The classification map is much less noisy and more accurate than those obtained by hierarchical rules. Starting with every point as a cluster, the algorithm works by melting the system to produce a tree of clusters in the scale space. It can cluster data in any multidimensional space and its insensitive to variability in cluster densities, sizes and ellipsoidal shapes. This algorithm, more powerful than existing ones, may be useful for remote sensing for land use 相似文献
14.
针对非对称语音库情况下的语音转换,该文提出一种新的改进的语音转换训练算法ILNCA。与原有的训练算法INCA不一样的是,ILNCA首先利用高斯混合模型(GMM)分别对源、目标语音特征参数空间进行分类。然后根据KullbackLeibler(KL)距离最小原则对源、目标GMM模型的子空间进行匹配,最后利用最近邻准则在相对应的子空间中进行源、目标语音特征参数矢量的对齐。客观测试和主观听觉实验都表明由于该文算法采用了更加精确的矢量对齐方法,能取得比INCA算法更优异的转换性能。 相似文献
15.
给出了一种散射模型与Wishart分类相结合的极化合成孔径雷达(polarimetric synthetic aperture radar, PolSAR)图像非监督分类方法。首先利用去取向三分量散射模型进行粗分类,将像素划分为三种基本散射类型和混合散射类型;然后,在基本散射类型内根据占优散射机制的功率进行细分类,并根据Wishart距离对细分类的结果进行类别合并,合并到指定的类别数;最后对四种散射类型的像素分别重新进行Wishart迭代,从而实现极化SAR数据的非监督分类。利用美国AIRSAR机载系统采集的实测数据进行实验,并且同已有分类方法进行比较,结果表明本文方法改善了分类效果,且降低了体散射过估计。 相似文献
16.
快速说话人自适应算法在非特定人连续语音识别的应用中有重要意义.现在流行的自适应算法多数只考虑均值的自适应.本文提出的自适应算法可以快速的对协方差矩阵进行自适应.该算法是用高斯相似度度量协方差矩阵间的距离,并由此测度建立了反映协方差矩阵结构关系的二叉决策树.树的每个中间节点包含一个类质心.在决策树基础上,训练多个与特定人模型相关的类质心.自适应时,通过对这些类质心进行线性插值得到自适应的协方差矩阵.实验结果表明,该方法能够在仅有一句自适应数据的情况下,使系统误识率由29.49%下降到27.55%. 相似文献
17.
基于L1范数凸包数据描述的多观测样本分类算法 总被引:1,自引:0,他引:1
为建立高维空间样本分布的最佳覆盖为目标来实现覆盖分类,该文提出基于L1范数凸包数据描述的多观测样本分类算法。首先对训练集的每个类别以及测试集的多观测样本分别构造凸包模型,这样多观测样本的分类就转化为凸包模型的相似性度量问题。若测试集的凸包模型与训练集无重叠,采用L1范数距离测度进行凸包模型之间的相似性度量;若有重叠,采用L1范数距离测度进行收缩凸包(reduced convex hulls)之间的相似性度量。然后采用最近邻准则作为多观测样本的分类决策。在3个数据库上进行的实验结果,表明该文提出方法对于多观测样本分类具有可行性和有效性。 相似文献
18.