首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 359 毫秒
1.
情感分类一直是自然语言处理任务中重要的研究热点,并在电子商务评论、热点论坛、公共舆论等众多场景中广泛应用。如何提高情感分类模型性能仍是情感分析领域的重点研究问题。集成学习是通过联合若干分类器达到提高模型总体效果的有效方法。基于粒计算和三支决策思想,并结合集成学习的优势,构建了结合集成学习的多粒度序贯三支决策模型。通过N-gram语言模型构建文本多粒度结构,形成序贯三支情感分类基础;在每一粒度下,集成三个分类算法以提高在该粒度下的分类效果;通过4个数据集对所提出方法进行了实验验证。结果证明,该方法不仅可以提高整体分类效果,还可以降低分类成本。  相似文献   

2.
为了解决文本情感分析的代价不平衡及静态决策中分类代价偏高的问题,文中考虑动态决策过程中产生的误分类代价和学习代价,构建基于序贯三支决策的代价敏感文本情感分析方法.首先,为了构建多粒度动态决策环境,提出针对文本数据的粒化模型.然后,引入序贯三支决策模型,构建动态文本分析框架.最后,利用真实文本评论数据集验证文中方法的有效性.实验表明文中方法在提高分类质量的同时,明显降低整体的决策代价.  相似文献   

3.
大数据时代下传统静态的情感分析方法已无法适应当前动态数据的量级和复杂度.为了改善传统的二支静态决策的不足,文中基于序贯三支决策思想提出基于时空多粒度的序贯三支情感分析方法.利用随时间增加的数据和拟合度较高的特征空间,构造具有时空特性的多层粒结构,平衡误分类代价和训练代价.使用3种基准分类器实际测试方法效率,在2个数据集上的实验表明,文中方法在维持分类质量的前提下,大幅减少分类代价.  相似文献   

4.
序贯三支决策方法是一种能够表示问题中的多重层次粒度,并将多粒度结合起来解决不确定决策问题的有效途径。优势-等价关系粗糙集则是针对条件属性具有偏好关系的分类问题,提取有序信息,对目标概念进行近似,从而形成决策知识。利用传统的优势关系粗糙集方法进行知识约简和提取的效率低下,而目前大部分序贯三支决策方法则局限在符号值属性的信息系统中,对连续值和有序值不能进行有效处理,造成一定程度的信息丢失。因此,将序贯三支决策的思想应用于优势关系粗糙集模型中,定义了一种新的基于序贯三支决策的属性约简及相应的属性重要度,对具有偏好值属性的信息系统进行更加高效的处理,通过多粒度的表示和关系的研究,加速了知识约简过程。选取了多组UCI数据进行实验,结果表明所提出的基于优势关系的序贯三支决策方法能够在保证约简质量的基础上明显降低时间耗费。  相似文献   

5.
序贯三支决策是三支决策理论近年发展起来的一种新型决策方法。传统的序贯三支决策方法鲜有针对序贯信息粒的构建和其在分类学习中的应用的研究。针对这两个问题,研究了Local约简与Global约简之间的内在序贯性,并以此构建了具有约简特性的序贯信息粒。在此基础上设计了一种序贯三支分类器。实验结果表明,该序贯三支分类器不仅能很好地在合适信息粒上进行分类,而且较传统的分类算法提高了数据集的分类精度。  相似文献   

6.
多类分类问题的实际应用中,在决策对象的认识由粗粒度向细粒度转化时,通过使用粒结构,提出一种基于多类分类的序贯三支决策模型。在此基础上,使用该模型非增量的方法计算序贯三支决策的时间开销较大,针对决策表中条件属性的变化,给出该模型的增量方法来进行决策。首先,通过增加新属性得到每层的条件属性,构建多层次粒结构。在多层次粒结构下,给出每层决策表的损失函数矩阵。然后,按层依次计算决策表中每个决策类的阈值,进行决策表的三支决策。最后,给出多类分类的序贯三支决策算法,通过实例说明该算法的计算过程。为了动态更新多层次下的三个域集,基于多类分类给出计算序贯三支决策的增量算法,通过仿真实验验证了该方法的有效性。  相似文献   

7.
基于序贯三支决策的图像识别方法仅考虑测试样本与支持向量机(SVM)分离超平面的符号距离,忽略了已有粒度层的信息,图像识别性能有待提高。提出一种新的置信度评价(dual confidence score and ensembling, DCE),将符号距离结合测试样本与特征空间中每一类训练样本中心的距离作为基本置信度,用于序贯三支决策时,将较粗粒度层无法识别图像的置信度与当前粒度层的置信度合并进行评价,有效地利用已有信息,提高识别准确度,在粒度层较粗时也能进行决策,提升了识别效率。在Caltech-101和Caltech-256数据集上使用两个经典预训练模型进行验证,与现有三支决策图像识别方法相比,实验结果表明该方法能有效提升识别的准确度和效率。  相似文献   

8.
针对传统基于二支决策的恶意代码检测方法在面对动态环境中的复杂海量数据时,没有考虑在信息不充足条件下进行决策产生影响的问题,本文提出了一种基于卷积神经网络的序贯三支决策恶意代码检测模型。通过卷积神经网络对样本数据进行特征提取并构建多粒度特征集,引入序贯三支决策理论对恶意代码进行检测。为改善检测模型整体性能,避免阈值选取的主观性,本文在上述模型的基础上,同时考虑模型的综合分类性能、决策效率和决策风险代价建立高维多目标序贯三支决策模型,并采用高维多目标优化算法对模型进行求解。仿真结果表明,模型在保证检测性能的同时,有效地提升了决策效率,降低了决策时产生风险代价,更好地拟合了真实动态检测环境。  相似文献   

9.
作为粒计算研究方向的核心概念和关键技术,多粒度计算强调对现实世界问题多视角、多层次的理解和描述,可获得合理、满意的求解结果.为了深化多粒度计算与决策分析的有效融合,更好地满足人们的实际决策需求,文中首先介绍多粒度粗糙集、多尺度数据分析、序贯三支决策、分层分类学习四类多粒度计算模型,并阐述各自的主要特点及发展过程.进而从属性约简、规则提取、粒度选择、信息融合、群决策、多属性群决策、分类决策、动态决策等方面总结基于多粒度计算模型的决策分析方法研究现状.最后,对大数据时代智能决策领域中若干具有挑战性的研究方向进行展望,以期推动多粒度智能决策的不断发展与创新.  相似文献   

10.
如何设计合理的属性子空间区间是序贯三支分类研究的重要内容之一.考虑到实际应用中广泛存在的数值数据,将邻域粗糙集及邻域决策错误率引入序贯三支分类方法中,构建合理的属性子空间区间.借助邻域决策错误率约简,分别定义局部和全局属性子空间,并基于此设计基于邻域决策错误率的序贯三支分类算法.在6组UCI数据集上的实验结果表明,该分类方法不仅压缩了数据的属性空间,而且提高了数据的分类精度,为序贯三支分类方法的研究提供了新的思路.  相似文献   

11.
粒度重要度是多粒度粗糙集中的一项重要研究内容。针对现有粒度重要度只考虑单个粒度对决策的直接影响而忽略了其他粒度对决策综合影响的问题,结合多粒度粗糙集近似质量的概念,通过研究粒度重要度的构造方法,提出了一种新的多粒度间的粒度重要度的计算方法,并给出了基于该方法的粒度约简算法。同时,为减少冗余决策信息,将约简集与三支决策理论相结合,构建了基于粒度重要度的三支决策模型,给出了决策规则。最后通过实例证明,新的粒度约简算法可以获得具有更高区分度的数据,且缩小了延迟域范围,使最终决策更合理。  相似文献   

12.
随着网络入侵行为的多样化和智能化,传统的入侵检测算法在面对高维特征、非线性的海量数据时,存在特征提取不充分、模型分类不够精确等问题,为此,提出了一种结合卷积神经网络(convolutional neural networks,CNN)和三支决策(three-way decision,TWD)的入侵检测算法。卷积神经网络具有优越的特征提取能力;同时,三支决策可以规避因信息不足而盲目分类造成的风险,且减少分类所耗费的时间。该方法通过卷积神经网络对高维数据进行特征提取,构建多粒度特征空间,然后基于三支决策理论对网络行为做出即时决策,对于无法即时决策的网络行为进行延迟决策,即对该部分网络行为再次特征提取以构建不同的粒度特征空间,最后输出分类结果。该方法建立的模型在NSL-KDD、CIC-IDS2017数据集上的实验结果表明,提出的算法可以提升入侵检测系统的性能。  相似文献   

13.
With the rapid development of the World Wide Web, electronic word-of-mouth interaction has made consumers active participants. Nowadays, a large number of reviews posted by the consumers on the Web provide valuable information to other consumers. Such information is highly essential for decision making and hence popular among the internet users. This information is very valuable not only for prospective consumers to make decisions but also for businesses in predicting the success and sustainability. In this paper, a Gini Index based feature selection method with Support Vector Machine (SVM) classifier is proposed for sentiment classification for large movie review data set. The results show that our Gini Index method has better classification performance in terms of reduced error rate and accuracy.  相似文献   

14.
现有三支决策主要针对各类完备信息系统或不完备单一型信息系统进行研究,而现实应用领域中数据往往呈现不完备性和复杂性等特征,为此,构建面向不完备混合决策系统的三支决策模型与规则获取方法。首先,计算不完备混合数据的完备邻域容差类,并将其代替等价类计算三支决策模型的条件概率;然后,根据扩展的损失函数区间概念获取各对象在乐观、折中和悲观决策下的不同阈值,进而针对不完备混合决策系统构造三种决策风险下的三支决策模型。最后,通过理论分析和医疗诊断实例详细分析了算法的有效性和可解释性,并通过实验比较和分析可知,所构模型较其他已有模型的分类过程更加合理有效,同时该模型也扩充了三支决策模型和知识发现的理论与应用研究。  相似文献   

15.
樊振  过弋  张振豪  韩美琪 《计算机应用》2018,38(11):3084-3088
针对评论文本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支持向量机(SVM)对评论文本进行情感分类。所提出的数据自动标注方法在两种类型数据集情感分类准确率上分别达到了77.2%和77.8%,相对于单一的利用用户评分对数据标注的方法,分别提高了1.7个百分点和2.1个百分点。实验结果表明,提出的数据自动标注方法在电影评论情感分析中能提高分类效果。  相似文献   

16.
针对现有三支决策模型的研究对象多为单一性数据的决策系统,对于混合数据边界域样本处理的研究相对较少,本文面向混合数据提出了基于核属性的代价敏感三支决策边界域分类方法。该方法基于正域约简计算混合邻域决策系统的核属性集,在此基础上计算混合邻域类,并利用三支决策规则分别将对象划分到各决策类的正域、边界域和负域;提出了一种基于代价敏感学习的三支决策边界域分类方法,并构造了误分类代价的计算方法,以此划分边界域中的对象。通过对UCI上的10个数据集进行实验对比与分析,进一步验证了本文方法,为处理边界域样本提供了一种可行有效的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号