首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
多粒度数据是一种特殊的、有用的数据类型,它通过对论域(研究对象的集合)采用不同的粒化方式使得数据能够在多个粒度空间中进行呈现,在此基础上可以开展数据的多层次知识发现研究.商空间理论、序贯三支决策、多粒度粗糙集、多尺度数据分析模型和多粒度形式概念分析是几种常见的、有效的多粒度数据分析方法,已受到人们的广泛关注.本文对基于...  相似文献   

2.
张刚强  刘群  纪良浩 《计算机科学》2018,45(12):153-159
如何对评论数据进行正确的情感分类是情感分析中的重要研究内容。从粒计算和认知学角度,提出了一种基于序贯三支决策的多粒度中文评论情感分类方法。首先,基于评论数据集的特点,根据评论中情感信息量的多少,提出一种由粗到细的多粒度情感信息表示方法;然后,结合序贯三支决策的思想在不同粒度依据情感信息进行逐步计算,对边界域评论序贯地进行三支决策;最后,根据不同粒度的决策阈值和成本对评论做出最终的情感分类。对比实验结果表明,该方法在3个经典评论数据集上获得了更好的结果,具有更高的分类正确率和更强的鲁棒性。  相似文献   

3.
4.
针对传统模型在解决不平衡数据分类问题时存在精度低、稳定性差、泛化能力弱等问题,提出基于序贯三支决策多粒度集成分类算法M GE-S3WD.采用二元关系实现粒层动态划分;根据代价矩阵计算阈值并构建多层次粒结构,将各粒层数据划分为正域、边界域和负域;将各粒层上的划分,按照正域与负域、正域与边界域、负域与边界域重新组合形成新的...  相似文献   

5.
情感分类一直是自然语言处理任务中重要的研究热点,并在电子商务评论、热点论坛、公共舆论等众多场景中广泛应用。如何提高情感分类模型性能仍是情感分析领域的重点研究问题。集成学习是通过联合若干分类器达到提高模型总体效果的有效方法。基于粒计算和三支决策思想,并结合集成学习的优势,构建了结合集成学习的多粒度序贯三支决策模型。通过N-gram语言模型构建文本多粒度结构,形成序贯三支情感分类基础;在每一粒度下,集成三个分类算法以提高在该粒度下的分类效果;通过4个数据集对所提出方法进行了实验验证。结果证明,该方法不仅可以提高整体分类效果,还可以降低分类成本。  相似文献   

6.
三支决策用于处理复杂的、不确定问题,将实际问题通过三元思维整体划分为分离且有内在联系的三个部分,针对不同部分采取不同行动从而指导最终决策。传统三支决策解决二分类问题,数据信息海量增长二分类问题逐渐扩展,多分类得到广泛关注。从三支决策理论出发,介绍多分类三支决策理论研究,总结二者的理论及应用成果,展望其未来研究方向。  相似文献   

7.
张越兵  苗夺谦  张志飞 《计算机科学》2017,44(12):188-193, 215
文本情感分类是一项重要的自然语言处理任务,具有广泛的应用场景。以往的情感分类方法过于注重分类准确率,忽略了训练和分类过程的时间代价,而且使用的特征大多为词袋特征,存在维度高、可解释性差的缺点。针对这些问题,将粒计算的思想运用于文本数据的三层粒度结构(词-句-篇章),提出一种具有强可解释性的文本情感分类特征——SSS(Sentence-level Sentiment Strength)特征,SSS特征每一维度代表文章中每个句子的情感强度值;同时,在分类过程中,利用三支决策方法将待分类对象划分为3个区域,位于正域和负域的对象直接划分至正类和负类中,使用SVM(Support Vector Machine)+SSS特征对位于边界域的对象做进一步分类。实验结果显示,SSS特征由于自身的低维特性,能够大大降低特征提取和模型训练过程所耗费的时间成本,结合了三支决策方法的SVM能够进一步提高分类准确率,而且三支决策方法可以减少分类过程所耗费的时间。  相似文献   

8.
大数据时代下传统静态的情感分析方法已无法适应当前动态数据的量级和复杂度.为了改善传统的二支静态决策的不足,文中基于序贯三支决策思想提出基于时空多粒度的序贯三支情感分析方法.利用随时间增加的数据和拟合度较高的特征空间,构造具有时空特性的多层粒结构,平衡误分类代价和训练代价.使用3种基准分类器实际测试方法效率,在2个数据集上的实验表明,文中方法在维持分类质量的前提下,大幅减少分类代价.  相似文献   

9.
决策粗糙集和多粒度粗糙集是两种重要的数据处理机制。在对多重代价决策粗糙集模型和多粒度粗糙集模型的研究基础上,通过综合考虑多重代价矩阵和多粒度思想,将权重均值代价策略引入决策粗糙集模型中,提出了一种基于权重多重代价的多粒度决策粗糙集模型。在不完备信息系统中,分析了悲观代价决策粗糙集、乐观代价决策粗糙集和权重多重代价多粒度决策粗糙集模型,并给出了以上各种模型的决策代价总代价计算公式。以权重多重代价悲观多粒度决策粗糙集模型为例,讨论了该模型下随着粒度的变化其正域的变化情况,并给出了一种基于代价最小化的粒度约简方法。该模型更好地结合了决策粗糙集模型和多粒度粗糙集模型,可从多角度分析解决决策粗糙集模型中的相关问题。  相似文献   

10.
为弥补多粒度决策粗糙集刻画不确定性知识能力的不足,鉴于监督学习能够考虑对象现有或预测的类别标签信息,在多粒度决策粗糙集中引入类内阈值和类间阈值的概念,提出了基于监督机制的多粒度决策粗糙集,给出模型的下、上近似,并对相关性质和结论进行证明。以工地项目建设的实例验证了模型的有效性与可靠性。实验结果表明,通过调整类内阈值和类间阈值,可进一步提高原模型的容错和分类能力。  相似文献   

11.
多粒度粗糙集本质上是异构的,但是目前尚未运用于异构数据处理.从绝对约简的角度出发,提出多粒度粗糙集的双层绝对约简——多粒度绝对约简和多粒度绝对粒度约简.分析多粒度双层绝对约简的性质,特别是从异构数据约简的角度探究多粒度双层绝对约简的特性,提出多粒度双层绝对约简算法.理论分析和实例表明多粒度双层绝对约简算法的可行性.  相似文献   

12.
在多粒度粗糙集模型中,粒度选择总是与正域有关.由于全体标记确定对象集上的分类过细,落入正域的对象很少或为空集,导致正域约简方法可能丢失大量信息甚至失效.为了克服这一缺陷,文中提出基于局部广义多粒度粗糙集的多标记最优粒度选择方法.首先,引入广义局部多粒度粗糙集的相关概念,通过设置信息水平参数,对单个标记的对象集合进行近似.然后,通过定义多粒度多标记信息系统的粒度质量,给出粒度重要性.最后,设计最优粒度选择的启发式算法,并通过实例验证文中方法的有效性  相似文献   

13.
针对多属性决策中多个相互冲突的属性信息使决策者很难做出决策判断的问题,文中从支持直觉模糊集的角度研究该问题.首先,在支持直觉模糊集的基础上,结合多粒度粗糙集理论,构造乐观、悲观两种多粒度支持直觉模糊粗糙集模型,分析两种模型之间的相互关系,讨论相关性质.然后,利用t-模和t-余模定义拟合函数,提出多粒度支持直觉模糊粗糙集的多属性决策求解方法,同时定义得分函数和精确函数排序决策结果,提取相应的决策规则,设计算法.实例分析表明,文中方法使决策者在处理信息冲突的多属性决策问题时可根据实际需求选择最优决策方案  相似文献   

14.
以多粒度粗糙集理论为背景,结合可变多粒度思想与错误分类率思想,提出可变多粒度概率粗糙集(VMGPRS)模型.结合粗糙集理论中的属性约简思想,提出粒度约简算法,发现并解决可变多粒度模型中由于参数设定而引发的约简后粒度冗余问题.将约简前后的数据应用于SVM、KNN、NB等经典分类算法,验证约简对数据的分类能力几乎无影响.将规则与算法结合,设计基于规则的分类算法,并且实验分析VMGPRS模型中的2个调节参数α、 β对分类器分类效果的影响.  相似文献   

15.
针对现有多粒度直觉模糊粗糙集决策模型的不足,提出粒度加权的多粒度直觉模糊粗糙集模型.首先研究加权多粒度直觉模糊粗糙集的基本性质,分析加权多粒度直觉模糊粗糙集与乐观多粒度、悲观多粒度直觉模糊粗糙集之间的关系,并给出这几种模型不确定度量之间的关系.然后给出决策规则的置信度和支持度定义以及决策规则的获取方法,弥补目前常用的多粒度直觉模糊粗糙集的不足.最后通过决策实例分析验证文中模型的有效性.  相似文献   

16.
多粒度粗糙集和覆盖粗糙集是2种重要的数据处理机制.文中从近似集和属性约简2个角度探讨完备信息系统与不完备信息系统中多粒度粗糙集和覆盖粗糙集的关系.通过构造信息系统的粒空间,证明乐观多粒度粗糙集近似等价于松覆盖粗糙集近似,悲观多粒度粗糙集近似等价于紧覆盖粗糙集近似,即乐观多粒度粗糙集和悲观多粒度粗糙集可分别表示为松覆盖粗糙集和紧覆盖粗糙集.进一步指出信息系统的2类多粒度粗糙集的协调集可转化为2类覆盖粗糙集的协调集,并刻画多粒度粗糙集约简与覆盖粗糙集约简间的密切联系.  相似文献   

17.
概念格理论与方法是形式概念分析研究中的基本内容,该研究已取得一系列的重要成果,主要集中在概念格模型推广、概念格构造、概念格约简、基于概念格的规则提取、概念知识空间、概念格的粒计算方法及概念格应用等研究方向.为了进一步促进形式概念分析的研究与发展,文中对现有的概念格理论与方法进行梳理、总结与展望.特别地,指出上述研究方向中存在的关键科学问题,进行一些理论分析,并提出初步的研究思路,为今后解决这些问题提供有益的参考.  相似文献   

18.
多粒度粗糙集理论为多源决策信息系统的规则提取提供一种有效的方法,而如何对决策规则集进行评价是利用规则进行合理准确的决策和对未知样本进行可靠预测的关键问题之一。针对已有规则性能评价指标的不足,提出整体确定性、整体协调性、整体支持度的3类整体决策性能评价指标。这些评价指标将为更多的决策问题求解提供一定的理论依据。  相似文献   

19.
在基于犹豫模糊距离的多属性决策问题中,定义距离测度和计算属性权重是两个关键点.在定义犹豫模糊数的距离测度时,针对添加相同元素,补齐较短犹豫模糊数,改变原有含义的问题,文中提出同时扩展两个犹豫模糊数使其达到相同长度的方法.再根据Pawlak的冲突分析理论,建立犹豫模糊信息系统的冲突分析模型,提出基于冲突度的计算属性权重的方法.最后给出求解犹豫模糊信息系统下多属性决策问题的具体方法.企业发展规划的实例说明文中方法的有效性和可行性.  相似文献   

20.
以数据仓库技术为基础的决策分析是数据处理的发展方向,目前正得到很多行业的应用。为提高科学决策能力,增强在市场经营等方面的正确判断能力,需要充分利用已经积累的大量的业务数据,以数据仓库技术为基础,构建数据处理和决策分析平台,进一步开发数据中蕴涵的信息,形成决策需要的对策方案和应对市场的反应策略。本文从数据仓库技术及数据分析技术出发,概念性地构建了可应用的数据仓库和分析系统,为今后在相关领域应用奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号