首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
在多标签分类问题中,标签之间往往是相关的,为了提高分类性能,利用标签之间的相关性,提出AdaBoost.MLR算法和标签相关性分析方法。AdaBoost.MLR算法采用余弦相似度来计算标签相关性矩阵,利用标签相关性矩阵对原始标签矩阵进行补全转换为模糊标签矩阵,将标签空间划分为标签集、标签相关集和标签无关集,结合标签之间的相关性和弱分类器的分类情况,对样本权重进行调整。AdaBoost.MLR算法也能解决多类别分类问题,在其标签相关性的计算中,根据已经训练的弱分类器得到的临时强分类器的分类结果,构造标签相似性矩阵。实验结果表明,文中提出的算法在实验数据集上优于现有的算法,尤其在标签相关性复杂的数据集上分类性能有显著提升。  相似文献   

2.
基于LS-SVM的多标签分类算法   总被引:2,自引:0,他引:2  
多标签分类是指部分样本同时归属多个类别.基于数据分解的算法因训练速度快、性能良好而得到广泛的应用.本文采用一对一分解策略,将k标签数据集分解为k(k-1)/2个两类单标签和两类双标签的数据子集.对每一训练子集统一用LS-SVM模型建立子分类器,当出现双标签样本时将其函数值设为0,并确定适当的分类阈值.对情感、景象和酵母数据集的实验结果表明,本文算法的某些性能指标优于现有一些常用的多标签分类方法.  相似文献   

3.
在多标签分类中,标签之间的相关关系是一个重要的因素。为了利用标签之间的相关关系,文章提出了一种基于相关信息熵的多标签分类算法,使用相关信息熵来衡量标签之间相关关系的强弱程度。首先找出相关信息熵值最大的k标签组合的集合,然后使用LP(Label Powerset)分类器对每一个标签组合进行训练。在7个不同实验数据集上的实验结果表明:文中提出的算法的分类性能在其中的大部分数据集上优于其它对比的分类算法,而其它对比的分类算法仅在某一个数据集上优于文中提出的算法。  相似文献   

4.
针对心脏瓣膜疾病模糊分类问题,提出了基于多标签AdaBoost的模糊分类改进算法。结合模糊集理论,采用隶属函数将疾病的严重程度映射到区间[0,1]内的实数值,将超声诊断结果用模糊标签向量表示。利用余弦相似性分析疾病之间的复杂关系,计算标签相关性矩阵并对模糊标签向量进行补充。结合实际问题选取合适的阈值,将标签空间划分为标签集、标签相关集和标签无关集。本文算法以最小化排序损失为目标,针对不同的标签给予不同的权值调整因子,调整样本权重更新速度,强迫弱分类器“关注”与样本标签相关性较高的标签。在临床超声心动图TEE监测数据集上的实验结果表明:在对超声诊断结果模糊化时,通过隶属函数将疾病的严重程度中的“无病”映射为0,“轻度”映射到区间[0.8,0.85],“中度”映射到区间[0.85,0.9],“重度”映射到区间[0.9,1],构造模糊标签矩阵,并通过标签相关性矩阵对其进行补充,此时所构造的分类器性能达到最优。将本文算法与AdaBoost.MLR算法、AdaBoost.MR算法、BPMLL算法、RankSVM算法和MLkNN算法进行对比分析,在多标签分类的5种评价指标上,本文算法的分类性能均优于其他对比算法,分类结果更接近超声诊断结果。相较于AdaBoost.MLR算法,本文算法的Ranking Loss 下降了15.8%左右, One error下降了23.8%左右;相较于AdaBoost.MR算法,本文算法的Ranking Loss和One error降低30%左右,Coverage下降了15.6%左右。  相似文献   

5.
针对BING算法对物体建模的不足,提出了multi-BING算法。该算法计算训练样本的CS-LBP特征,并对其进行聚类,对聚类后的数据建立BING模型。在物体检测过程中,融合了多个模型结果进行候选框判别,将多标签图像分类问题转化为多个单标签分类问题。以Fast R-CNN模型为基础,将采用本文物体检测方法得到的候选框作为模型输入。同时,采用LReLU函数作为Fast R-CNN模型的激活函数,从而在几乎不增加计算复杂度的情况下,提高模型的平均准确率(AP)。实验表明,本文方法优于BING算法和OBN算法。  相似文献   

6.
在多标签新闻分类问题中,针对传统分类器链算法难以确定标签依赖顺序、集成模型运行效率低和无法应用复杂模型作为基分类器的问题,提出基于深度神经网络的双向分类器链算法. 该方法利用正向分类器链获取每个标签和前面所有标签的依赖关系,引入逆向分类器链,从正向链最后一个基分类器的输出开始反向学习每个标签和所有其他标签的相关性. 为了提取非线性标签相关性和提高预测性能,使用深度神经网络作为基分类器. 结合2条分类器链的均方误差,使用随机梯度下降算法对目标函数进行有效优化. 在多标签新闻分类数据集RCV1-v2上,将所提算法与当前主流的分类器链算法和其他多标签分类算法进行对比和分析. 实验结果表明,利用深度双向分类器链算法能够有效提升预测性能.  相似文献   

7.
针对多标签AdaBoost系列算法,以尽量减小算法的学习错误率为目的,提出了对其进行改进的两种思路。基于改进思路构造出了改进的多标签AdaBoost算法。一种思路是修改算法的样本分布调整策略,破坏现有AdaBoost算法中样本分布的均匀性,以确保增加每一个弱分类器都能降低学习错误的上界估计,从而实现对多标签AdaBoost算法的改进。另一种思路是训练弱分类器时兼顾后续待学习的弱分类器对学习错误的影响,克服现有算法在训练弱分类器时只考虑当前的弱分类器对学习错误的影响,而完全忽略后续待学习的弱分类器对学习错误的影响这一现象,从而改进多标签AdaBoost算法。理论上,对于改进多标签AdaBoost算法,增加每一个弱分类器都能进一步降低学习错误。理论分析和实验结果均表明了提出的改进算法有改进效果。  相似文献   

8.
结合安全生产事故案例文本特点,利用自然语言处理(NLP)技术对安全生产事故分类,基于转换器的双向编码表征(BERT)模型利用“抽取+生成”相结合的方式获得文本摘要,再通过迁移学习训练提升模型性能,并利用分组分类算法对文本的52个标签进行多标签分类,获得较好的分类效果,为安全生产监管、事故隐患的排查和分析奠定基础。  相似文献   

9.
基于CNN特征空间的微博多标签情感分类   总被引:1,自引:0,他引:1  
面对微博情感评测任务中的多标签分类问题时,基于向量空间模型的传统文本特征表示方法难以提供有效的语义特征。词向量表示能体现词语的语法和语义关系,并依据语义合成原理构建句子的特征表示。本文提出一个针对微博句子的多标签情感分类系统,采用经过有监督情感分类学习后的卷积神经网络(Convolution Neural Network, CNN)模型,将词向量合成为微博句子的向量表示,使得此CNN特征空间中的句子向量具有很好的情感语义区分度。在2013年NLPCC(Natural Language Processing and Chinese Computing)会议的微博情感评测公开数据集上,相比最优评测结果的宽松指标和严格指标,本系统的最佳分类性能分别提升了19.16%和17.75%;相比目前已知文献中的最佳分类性能,则分别提升了3.66%和2.89%。  相似文献   

10.
针对博文内容包含多主题、类别归属不明显,以及传统的文本分类方法直接应用于博文效果不理想等问题,提出了一种基于标签的博客文章分类方法.该方法将文本分类问题转化为图优化问题,并提出了一种利用迭代算法计算图中节点属于各类别的概率值.实验结果表明,与传统的文本分类方法相比,所提出的分类方法有效地提高了博文的分类性能.  相似文献   

11.
It is a key challenge to exploit the label coupling relationship in multi-label classification (MLC) problems. Most previous work focused on label pairwise relations, in which generally only global statistical information is used to analyze the coupled label relationship. In this work, firstly Bayesian and hypothesis testing methods are applied to predict the label set size of testing samples within their k nearest neighbor samples, which combines global and local statistical information, and then apriori algorithm is used to mine the label coupling relationship among multiple labels rather than pairwise labels, which can exploit the label coupling relations more accurately and comprehensively. The experimental results on text, biology and audio datasets shown that, compared with the state-of-the-art algorithm, the proposed algorithm can obtain better performance on 5 common criteria.  相似文献   

12.
In this paper a novel coupled attribute similarity learning method is proposed with the basis on the multi-label categorical data (CASonMLCD). The CASonMLCD method not only computes the correlations between different attributes and multi-label sets using information gain, which can be regarded as the important degree of each attribute in the attribute learning method, but also further analyzes the intra-coupled and inter-coupled interactions between an attribute value pair for different attributes and multiple labels. The paper compared the CASonMLCD method with the OF distance and Jaccard similarity, which is based on the MLKNN algorithm according to 5 common evaluation criteria. The experiment results demonstrated that the CASonMLCD method can mine the similarity relationship more accurately and comprehensively, it can obtain better performance than compared methods.  相似文献   

13.
为了充分利用标注词间的相关性,提高图像标注精度,解决图像检索中的语义鸿沟问题,提出了一种基于联合媒体相关模型的图像自动标注改进算法.该算法将标注词和图像的联合概率求解过程转换成在标注词条件下图像出现的概率和标注词的先验概率的求解过程,减少了高频候选标注词对概率统计模型的影响,同时引入语义相似语言模型,利用上下文关联词矢量表示每个标注词,通过估计1幅图像的1组相关性最大的标注词来实现对图像的标注.与基于联合媒体相关图像自动标注算法相比,在标注过程中,本算法不再假设模型中各标注词之间是相互独立的,充分考虑标注词上下文的相关性信息,提高了图像标注精度;对标准的Corel图像集实验结果表明,基于联合媒体相关模型的图像自动标注改进算法是有效的.  相似文献   

14.
一种资源占用最小的并行LSPs流量分配算法   总被引:3,自引:1,他引:3  
提出了一种资源占用最小的并行标签交换路径(LSPs)流量分配算法。该算法根据LSP(label switch paths)的跳数和时延来进行自适应流量分配,避免了传统基于最短路径路由流量分配算法引起的网络拥塞。仿真表明,该算法经过约15次迭代就可以收敛到预定的阈值,实现多协议交换网络资源的优化利用。  相似文献   

15.
针对数字信号的调制方式识别问题,给出了一种基于相关向量机的分类方法。相关向量机基于贝叶斯学习方法,其判决函数仅取决于训练样本的一小部分。文章提取信号的谱相关特征参数,设计了合理的分类策略。实验结果表明,与支持向量机相比,基于相关向量机的分类方法在保持较高识别率的同时,提高了调制识别的时效性。  相似文献   

16.
潘思远    刘园奎    毛煜    林耀进   《南京师范大学学报》2023,(1):066-74
多标记学习可以同时处理与一组标记相关的数据,多标记学习的研究对于多义性对象的学习建模具有十分重要的意义. 与传统的单标记学习一样,数据的高维性是多标记学习的阻碍,因此数据降维是一项十分重要的工作,而特征选择是一种有效的数据降维技术. 提出了基于邻域近似误差率的多标记特征选择算法. 首先,在邻域粗糙集理论的基础上,引入实例的边界来对所有实例进行粒度化. 其次,基于邻域决策误差率提出了邻域近似误差率的策略来评价特征. 最后,在公开的数据集上进行了大量的实验,结果表明所提算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号