首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
《工矿自动化》2017,(5):22-26
提出了一种基于距离度量学习的煤岩识别方法。该方法首先从煤岩图像训练集中提取煤岩图像特征;然后学习到特定的距离度量,使得煤样本特征间、岩石样本特征间距离变小,煤样本特征与岩石样本特征间距离变大,以提高分类识别效果;最后采用分类器进行煤岩识别。实验结果表明,对于煤岩样本图像的LBP特征、HOG特征、GLCM特征,与基于欧式距离、LDA、ITML的煤岩识别方法相比,该方法具有更高的煤岩识别率。  相似文献   

2.
为了能够更好地对非独立同分布的多尺度分类型数据集进行研究,基于无监督耦合度量相似性方法,提出针对非独立同分布的分类属性型数据集的多尺度聚类挖掘算法。首先,对基准尺度数据集进行基于耦合度量的基准尺度聚类;其次,提出基于单链的尺度上推和基于Lanczos核的尺度下推尺度转换算法;最后,利用公用数据集以及H省真实数据集进行实验验证。将耦合度量相似性(Couple metric similarity, CMS)、逆发生频率(Inverse occurrence frequency, IOF)、汉明距离(Hamming distance, HM)等方法与谱聚类结合作为对比算法,结果表明,尺度上推算法与对比算法相比,NMI值平均提高13.1%,MSE值平均减小0.827,F-score值平均提高12.8%;尺度下推算法NMI值平均提高19.2%,MSE值平均减小0.028,F-score值平均提高15.5%。实验结果表明,所提出的算法具有有效性和可行性。  相似文献   

3.
数据不平衡现象在现实生活中普遍存在。在处理不平衡数据时,传统的机器学习算法难以达到令人满意的效果。少数类样本合成上采样技术(Synthetic Minority Oversampling Technique,SMOTE)是一种有效的方法,但在多类不平衡数据中,边界点分布错乱和类别分布不连续变得更加复杂,导致合成的样本点会侵入其他类别区域,造成数据过泛化。鉴于基于海林格距离的决策树已被证明对不平衡数据具有不敏感性,文中结合海林格距离和SMOTE,提出了一种基于海林格距离和SMOTE的上采样算法(Based on Hellinger Distance and SMOTE Oversampling Algorithm,HDSMOTE)。首先,建立基于海林格距离的采样方向选择策略,通过比较少数类样本点的局部近邻域内的海林格距离的大小,来引导合成样本点的方向。其次,设计了基于海林格距离的采样质量评估策略,以免合成的样本点侵入其他类别的区域,降低过泛化的风险。最后,采用7种代表性的上采样算法和HDSMOTE算法对15个多类不平衡数据集进行预处理,使用决策树的分类器进行分类,以Precision,Recall,F-measure,G-mean和MAUC作为评价标准对各算法的性能进行评价。实验结果表明,相比于对比算法,HDSMOTE算法在以上评价标准上均有所提升:在Precision上最高提升了17.07%,在Recall上最高提升了21.74%,在F-measure上最高提升了19.63%,在G-mean上最高提升了16.37%,在MAUC上最高提升了8.51%。HDSMOTE相对于7种代表性的上采样方法,在处理多类不平衡数据时有更好的分类效果。  相似文献   

4.
谱聚类算法受到度量中尺度因子的影响,同时传统谱聚类算法通过欧氏距离度量样本间相似性也不准确。针对上述问题,提出一种基于传递距离的谱聚类算法。算法首先通过改进传统谱聚类中的度量方式,用基于传递距离的度量方式度量样本间相似性,并构建传递矩阵,接着用传递矩阵做相似度变换构建拉普拉斯矩阵,最终通过求特征值和特征向量完成聚类。基于传递距离的谱聚类算法在人工数据集及UCI数据集上均取得了良好的聚类结果,具有较好的鲁棒性和有效性。  相似文献   

5.
车辆再识别(Re-identification)是计算机视觉领域的研究热点之一,其关键在于车辆辨别性特征的提取.为了更好地提取此类特征,本文提出了一种基于全尺度和注意力融合学习的特征提取方法,该方法通过多个感受野获取不同尺度的特征,并将提取到的不同尺度特征融合;同时为了在特征提取过程中重点关注辨别性特征,特引入注意力机...  相似文献   

6.
针对基于相对距离的自由文本击键特征分类识别方法(R方法),提出了一种基于归一化编辑距离的自由文本击键特征分类识别方法.通过数据收集、预处理、距离计算、归一化处理、分类判定等过程,实现了对中文自由文本击键特征样本进行准确分类识别的方法.实验证明,本方法比R方法的分类正确率更高,识别准确度更好.  相似文献   

7.
王立林  刘俊 《计算机应用》2019,39(12):3691-3696
针对复杂海洋环境下人工监管船舶行为效率低的问题,提出了一种基于多尺度卷积神经网络的船舶行为识别方法。首先,从船舶自动识别系统(AIS)中获取海量船舶行驶数据,并提取出具有判别力的船舶行为轨迹;然后,根据轨迹数据的特性,利用多尺度卷积设计并实现了针对船舶轨迹数据的行为识别网络,并且使用特征通道加权以及长短时记忆网络(LSTM)来提高算法的准确率。在船舶行为数据集上的实验结果表明,对于指定长度的船舶轨迹,所提识别网络能够达到92.1%的识别准确率,相较于传统的卷积神经网络提高了5.9个百分点,并且在稳定性以及收敛速度上都有明显提升。该方法能够有效地提高船舶行为的识别精度,为海洋监管部门提供高效的技术支持。  相似文献   

8.
从已知数据集中学习距离度量在许多机器学习应用中都起着重要作用。传统的距离学习方法通常假定目标距离函数为马氏距离的形式,这使得学习出的距离度量在应用上具有局限性。提出了一种新的距离学习方法,将目标距离函数表示为若干候选距离的线性组合,依据最大间隔理论利用数据集的边信息学习得到组合距离中各距离分量的权值,从而得到新的距离度量。通过该距离度量在模糊C均值聚类算法中的表现来对其进行评价。在UCI数据集上,与其他已有的距离学习算法的对比实验结果证明了该文算法的有效性。  相似文献   

9.
为了提高说话人识别的准确率,对常用说话人特征优化算法进行研究。针对加权系数法用升半正弦函数求加权系数没有考虑特征参量具体情况的缺点,提出一种基于类内、类间距离求加权系数的说话人特征优化算法。此算法对于具体的说话人识别选择更加适合的加权系数。对于各种说话人特征优化算法进行仿真实验,结果表明,改进算法对于说话人特征优化的效果更好,识别率可以达到非常满意的效果。  相似文献   

10.
针对有效利用图像底层视觉特征和图像语义特征进行图像标注,提出一种改进的AP(Affinity Propagation)聚类标注模型。首先采用半监督距离测度学习算法,融合图像语义信息,训练得到新的距离测度。然后使用新的距离测度对每一类图像进行AP聚类,生成各类图像的聚类中心,计算待标注图像到各类图像聚类中心的平均距离,确定待标注图像类别。最后计算待标注图像到类内各个聚类中心的距离,确定待标注图像类内类别,统计该类别下图像的标注词,作为待标注图像的标注词。在Corel5K和NUS-WIDE数据集上进行了实验,经验证,该方法有效提高了标注精度。  相似文献   

11.
使用边信息进行距离学习的方法在许多数据挖掘应用中占有重要位置,而传统的距离学习算法通常使用马氏距离形式的距离函数从而具有一定的局限性。提出了一种基于混合距离进行距离学习的方法,数据集的未知距离度量被表示为若干候选距离的线性组合,利用数据的边信息学习得到各距离所占权值从而得到新的距离函数,并将该距离函数应用于聚类算法以验证其有效性。通过与其他已有的距离学习方法进行对比,基于UCI(University of California,Irvine)数据集的实验结果证明了该算法具有明显的优势。  相似文献   

12.
牛科  张小琴  贾郭军 《计算机工程》2015,41(1):207-210,244
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响。针对谱聚类算法中距离度量的选取问题,提出一种基于边信息距离度量学习的谱聚类算法。该算法利用数据集本身蕴涵的边信息,即在数据集中抽样产生的若干数据样本之间是否具有相似性的信息,进行距离度量学习,将学习所得的距离度量准则应用于谱聚类算法的相似度计算函数,并据此构造相似度矩阵。通过在UCI标准数据集上的实验进行分析,结果表明,与标准谱聚类算法相比,该算法的预测精度得到明显提高。  相似文献   

13.
为解决面部表情识别中不同图像的背景信息和身份特征会干扰分类准确率的问题,提出一种将图像合成技术和深度度量学习相结合的身份感知人脸表情识别方法,通过在面部表情识别任务中创建相同身份下的表情组,对人脸图像特征进行比较分类.其结构中对抗生成网络,目标在于学习表情信息并生成表情组;特征提取网络用于将图像转化成为可进行度量学习的...  相似文献   

14.
甲骨文字图像可以分为拓片甲骨文字与临摹甲骨文字两类. 拓片甲骨文字图像是从龟甲、兽骨等载体上获取的原始拓片图像, 临摹甲骨文字图像是经过专家手工书写得到的高清图像. 拓片甲骨文字样本难以获得, 而临摹文字样本相对容易获得. 为了提高拓片甲骨文字识别的性能, 本文提出一种基于跨模态深度度量学习的甲骨文字识别方法, 通过对临摹甲骨文字和拓片甲骨文字进行共享特征空间建模和最近邻分类, 实现了拓片甲骨文字的跨模态识别. 实验结果表明, 在拓片甲骨文字识别任务上, 本文提出的跨模态学习方法比单模态方法有明显的提升, 同时对新类别拓片甲骨文字也能增量识别.  相似文献   

15.
主流的距离度量学习方法都需要求解半正定规划(Semi definite programming, SDP )问题,而其中每次循环迭代中的矩阵完全 特征分解运算使得现有方法计算复杂度很高,实用性不强,难以应用在大规模数据环境。 本文提出了一种基于特征分组与特征值最优化的距离度量学习方法。引入特征分 组算法,根据特征各维数之间相关性对图像底层特征进行分组。在一定的约束条件下 ,将求解SDP问题转化为特征值最优化问题,在每次循 环迭代中只需计算矩阵最大特征值对应的特征向量。实验结果表明该方法能有效地降低计算 复杂度,减少度量矩阵的学习时间,并且能取得较好的分类结果。  相似文献   

16.
基于混合距离学习的双指数模糊C均值算法   总被引:2,自引:0,他引:2  
王骏  王士同 《软件学报》2010,21(8):1878-1888
提出了一种基于DI-FCM(double indices fuzzy C-means)算法框架的无监督距离学习算法——基于混合距离学习的双指数模糊C均值算法HDDI-FCM(double indices fuzzy C-means with hybrid distance).数据集未知距离度量被表示为若干已有距离的线性组合,然后执行HDDI-FCM,在对数据集进行有效聚类的同时进行距离学习.为了保证迭代算法收敛,引入了Steffensen迭代法来改进计算簇中心点的迭代公式.讨论了算法中参数的选择.基于UCI(University of California,Irvine)数据集的实验结果表明该算法是有效的.  相似文献   

17.
为解决传统推荐系统中存在的冷启动难题,基于距离反映偏好的假设提出了一种融合矩阵分解与距离度量学习的社会化推荐算法。该算法同时对样本和距离度量进行训练,在满足距离约束的前提下更新距离度量和用户与项目的坐标,并将用户与项目嵌入到统一的低维空间,利用用户与项目之间的距离生成推荐结果。基于豆瓣和Epi-nions数据集的对比实验结果验证了该方法可有效提高推荐系统的可解释性和精确度,明显优于基于矩阵分解的推荐方法。研究结果表明,所提方法缓解了传统推荐系统中存在的冷启动问题,为推荐系统的研究提供了另一种可供参考的研究思路。  相似文献   

18.
邹朋成  王建东  杨国庆  张霞  王丽娜 《软件学报》2013,24(11):2642-2655
对于时间序列聚类任务而言,一个有效的距离度量至关重要.为了提高时间序列聚类的性能,考虑借助度量学习方法,从数据中学习一种适用于时序聚类的距离度量.然而,现有的度量学习未注意到时序的特性,且时间序列数据存在成对约束等辅助信息不易获取的问题.提出一种辅助信息自动生成的时间序列距离度量学习(distancemetric learning based on side information autogeneration for time series,简称SIADML)方法.该方法利用动态时间弯曲(dynamic time warping,简称DTW)距离在捕捉时序特性上的优势,自动生成成对约束信息,使习得的度量尽可能地保持时序之间固有的近邻关系.在一系列时间序列标准数据集上的实验结果表明,采用该方法得到的度量能够有效改善时间序列聚类的性能.  相似文献   

19.
针对不同尺度空间集合中数据样本无法直接匹配的问题,提出融合类别和结构信息的多尺度协同耦合度量学习方法.首先将类别信息作为主要监督信息,样本分布结构信息作为辅助监督信息,构建相关关系矩阵.然后基于该相关关系矩阵构建线性和非线性最优化目标方程,通过最优化目标方程求解将不同尺度数据集合中的数据样本变换至尺度统一的公共空间,最终实现不同尺度空间中数据样本的度量.人脸识别的实验表明,多尺度空间的非线性协同耦合度量是一种有效的度量方法,运算简单方便,能够获得较高的识别率.  相似文献   

20.
《计算机科学与探索》2017,(9):1461-1473
最近邻特征空间嵌入(nearest feature space embedding,NFSE)方法选取最近邻特征空间时使用欧氏距离度量,导致样本的类内离散度和类间离散度同步变化,无法准确反映样本在高维空间的分布;选取每个样本最近邻特征空间都要遍历所有类,导致训练时间长。针对以上问题,提出非线性距离的最近邻特征空间嵌入改进方法(nearest feature space embedding method based on nonlinear distance metric,NDNFSE),引入非线性距离公式选取最近邻特征空间,并使用结合夹角度量的最近邻分类器,提高了识别率;仅在样本的近邻类中选取最近邻特征空间,有效减少了训练时间。实验表明,NDNFSE的训练时间明显低于NFSE,识别率总体高于各对比算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号