首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
情感分类一直是自然语言处理任务中重要的研究热点,并在电子商务评论、热点论坛、公共舆论等众多场景中广泛应用。如何提高情感分类模型性能仍是情感分析领域的重点研究问题。集成学习是通过联合若干分类器达到提高模型总体效果的有效方法。基于粒计算和三支决策思想,并结合集成学习的优势,构建了结合集成学习的多粒度序贯三支决策模型。通过N-gram语言模型构建文本多粒度结构,形成序贯三支情感分类基础;在每一粒度下,集成三个分类算法以提高在该粒度下的分类效果;通过4个数据集对所提出方法进行了实验验证。结果证明,该方法不仅可以提高整体分类效果,还可以降低分类成本。  相似文献   

2.
赵帅群  郭虎升    王文剑 《智能系统学报》2019,14(6):1243-1254
粒度支持向量机(granular support vector machine,GSVM)引入粒计算的方式对原始数据集进行粒度划分以提高支持向量机(support vector machine, SVM)的学习效率。传统GSVM采用静态粒划分机制,即通过提取划分后数据簇中的代表信息进行模型训练,有效地提升了SVM的学习效率,但由于GSVM对信息无差别的粒度划分导致对距离超平面较近的强信息粒提取不足,距离超平面较远的弱信息粒被过多保留,影响了SVM的学习性能。针对这一问题,本文提出了采用划分融合双向控制的粒度支持向量机方法(division-fusion support vector machine,DFSVM)。该方法通过动态数据划分融合的方式,选取超平面附近的强信息粒进行深层次的划分,同时将距离超平面较远的弱信息粒进行选择性融合,以动态地保持训练样本规模的稳定性。通过实验表明,采用划分融合的方法能够在保证模型训练精度的条件下显著提升SVM的学习效率。  相似文献   

3.
粒计算(granular computing, GrC)是知识表示和数据挖掘的一个重要方法,它模拟人类思考模式,以粒为基本计算单位,以建立大规模复杂数据和信息处理的有效计算模型为目标.粒计算主要研究粒的构造、解释、表示、粒度的选择以及用规则形式所描述的粒与粒之间的关系等.针对具有多粒度标记的不完备信息系统的知识获取问题,首先,介绍了广义不完备多粒度标记信息系统的概念,在该信息系统中定义了相似关系,给出了在不同粒度标记层面下信息粒的表示及其相互关系,并定义了基于相似关系的集合的下、上近似概念,给出了近似算子的性质;其次,定义了广义不完备多粒度标记决策系统中的粒度标记选择的概念,阐明了所有粒度标记选择全体构成了一个完备格;最后,讨论了广义不完备多粒度标记决策系统中的最优粒度标记选择问题,并用证据理论中的信任函数和似然函数刻画了协调的不完备多粒度标记决策系统的最优粒度选择特征.  相似文献   

4.
针对传统模型在解决不平衡数据分类问题时存在精度低、稳定性差、泛化能力弱等问题,提出基于序贯三支决策多粒度集成分类算法M GE-S3WD.采用二元关系实现粒层动态划分;根据代价矩阵计算阈值并构建多层次粒结构,将各粒层数据划分为正域、边界域和负域;将各粒层上的划分,按照正域与负域、正域与边界域、负域与边界域重新组合形成新的...  相似文献   

5.
以多粒度粗糙集理论为背景,结合可变多粒度思想与错误分类率思想,提出可变多粒度概率粗糙集(VMGPRS)模型.结合粗糙集理论中的属性约简思想,提出粒度约简算法,发现并解决可变多粒度模型中由于参数设定而引发的约简后粒度冗余问题.将约简前后的数据应用于SVM、KNN、NB等经典分类算法,验证约简对数据的分类能力几乎无影响.将规则与算法结合,设计基于规则的分类算法,并且实验分析VMGPRS模型中的2个调节参数α、 β对分类器分类效果的影响.  相似文献   

6.
作为粒计算研究方向的核心概念和关键技术,多粒度计算强调对现实世界问题多视角、多层次的理解和描述,可获得合理、满意的求解结果.为了深化多粒度计算与决策分析的有效融合,更好地满足人们的实际决策需求,文中首先介绍多粒度粗糙集、多尺度数据分析、序贯三支决策、分层分类学习四类多粒度计算模型,并阐述各自的主要特点及发展过程.进而从属性约简、规则提取、粒度选择、信息融合、群决策、多属性群决策、分类决策、动态决策等方面总结基于多粒度计算模型的决策分析方法研究现状.最后,对大数据时代智能决策领域中若干具有挑战性的研究方向进行展望,以期推动多粒度智能决策的不断发展与创新.  相似文献   

7.
粒度计算是一种新的智能计算的理论和方法,目前受到很多学者的关注。但是,具体可行的粒表示模型和不同粒的推理方法研究相对较少。本文将模糊粗糙集纳入粒度计算这种新的理论框架,对于处理复杂信息系统,求解复杂问题无疑具有重要的意义。首先利用笛卡尔积,构建了模糊关系下的信息粒;然后给出不同粒度下模糊粗糙算子的表示方法,进而形成一个分层递阶结构;最后考虑了对于模糊信息系统粒度粗细的选择问题,并给出一个实例,从而为粒度计算提供一个具体而实用的框架。  相似文献   

8.
针对SVM (support vector machine)算法应用到大规模网络流量分类中存在计算复杂度高、训练速度慢等问题,提出一种基于云计算平台进行并行网络流量分类的SVM方法,以提高对大数据集的分类训练速度.该方法是一种采用云计算平台构建多级SVM和映射规约(MapReduce)模型的方法.它将训练数据集划分为多个子训练数据集,通过对所有子训练数据集进行并行训练,得到支持向量集,进而训练出流量分类模型.实验结果表明,与传统的SVM方法相比,并行SVM网络流量分类方法在保持较高分类精度的前提下,有效地减少了训练时间,提高了大规模网络流量分类的速度.  相似文献   

9.
图像信息中存在的不确定性问题会影响图像的分割效果.为此,提出一种基于粒计算和云模型的彩色图像分割算法.研究多粒度认知模型,在HSV颜色空间中利用云模型构建彩色图像的信息粒,进行多粒度、多层次的云粒合成,实现彩色图像分割.实验结果表明,与PCNN算法和K均值算法相比,该算法的分割效果较好.  相似文献   

10.
粒计算是研究和模拟人类认知从多粒度、多层次解决问题的方法,近年来成为智能信息处理中一个热点方向。云模型是一个基于概率理论研究定性定量转换认知模型的粒计算方法,通过正向和逆向云算法实现一组数据样本和一个基本概念之间的转换,但是目前的算法不能在整个问题域中解决多粒度、多概念的生成问题。概率统计中的高斯混合模型可以将任何一个频率分布函数转换成多个高斯分布的叠加,在此基础上,创新地提出用云模型中数字特征构建概念含混度作为概念外延共识程度的衡量,设计并实现了高斯云变换算法,将问题域中的数据分布自动转换为多粒度的不同概念,构建出人类概念认知中的泛概念树。通过在数据概念聚类和图像分割中的应用,验证了方法的有效性。  相似文献   

11.
基于SVM一对一多分类算法的二次细分法研究   总被引:2,自引:0,他引:2  
在研究了支持向量机(SVM)多分类算法的基础之上,针对一对一多分类算法出现不可分区域问题,提出了基于SVM一对一多分类算法的二次细分方法,并将该方法应用于弹簧应力小样本数据的多分类仿真实验。通过与原始方法的仿真结果进行对比,改进方法在多花费了极短时间的前提下,显著提高了分类正确率。针对改进方法可能存在的问题,又通过10次仿真实验验证了该方法的可行性,同时也为SVM在小样本分类领域提供了新的思路。  相似文献   

12.
文章研究了基于粒度计算理论的数据分类建模,引入了全粒度空间的概念,定义了集合的粒度表示,给出了概念学习在粒度计算理论中的解释,导出了一个基于数据分类的知识发现模型,从而说明了知识发现可归结为在全粒度空间中寻找目标概念的最佳粒度表示,而各粒度描述的析取构成决策规则的前件。  相似文献   

13.
基于商空间粒度计算的SAR图像分类   总被引:3,自引:0,他引:3  
SAR图像的分类是实现SAR图像自动理解与解译的图像的分类提供了大量有用的信息,尤其对于单波段、单极化的SAR图像,纹理信息就显得格外重要.然而,不同纹理特征对SAR图像中不同地表结构内在属性的刻画能力并不一致.如何将不同纹理特征结合起来,以获得应用范围更广且分类效果更好的SAR图像分类方法,是当前SAR图像处理研究中的一个热点问题.文章将商空间粒度计算引入SAR图像的分类中,结合SAR图像特性,提出了一种基于粒度合成理论的SAR图像分类方法.该方法首先利用具有良好推广能力的支撑矢量机基于不同纹理特征获得SAR图像的不同分类结果,并认为这些分类结果构成不同的商空间,再根据粒度合成理论将这些商空间组织起来得到SAR图像的最终分类结果.实验结果验证了这种方法的有效性和正确性以及商空间的粒度计算在SAR图像分析中的应用潜力.  相似文献   

14.
针对动态时间弯曲(DTW)算法在提高计算速度同时不能兼顾分类正确率的问题,提出了一种基于朴素粒计算思想的弹性粗粒度动态时间弯曲(CG-DTW)算法。首先,通过计算时序方差特征的方法来获取较优的时序粒度,用粒度特征代替原始序列;其次,再代入执行DTW算法,允许动态调整被比较时序粒间的弹性大小,从而获得相对最优的时序对应粒;最后,在对应最优粒的情况下计算DTW距离。同时引入下界函数的提前终止策略进一步提高CG-DTW算法效率。实验结果表明,所提算法要比经典算法运行速率提高21.4%左右,比降维策略算法正确率提高近32.3个百分点,尤其是长序列的分类,CG-DTW能够在保持正确率的情况下兼顾较高的运行效率。CG-DTW在实际应用中能适应不确定长序列分类。  相似文献   

15.
在多分类问题中,分类算法的优劣直接影响到最终分类结果的好坏。现有的多分类算法中,基于支持向量机的多分类算法在综合性能方面要优于其他算法,但是,这些较优算法同样面临一些多分类中常见的问题,如不可分问题和效率低问题。针对这些问题,文中提出了一种改进的二叉树支持向量机多分类算法,该算法综合考虑了两个类之间的距离和分布情况对可分离性的影响,并采用最容易分离的类最先分割出来的策略来建立树的结构。通过在不同的数据集上进行测试,表明该方法不仅解决了多分类的不可分问题,还能提高分类的效率和准确度,可更好地解决现实中的多分类问题。  相似文献   

16.
支持向量机是在模式分类中表现优秀的一种分类方法。对现有的基于SVM的文本多类分类方法进行了介绍和比较,研究了分类器特征空间模式问题,在这些工作基础上,提出了并行SVM的模型。  相似文献   

17.
在实际应用中,数据集样本规模、分布密度的不平衡性可能会使传统支持向量机(support vector machine, SVM)得到的分类超平面不是最优.在对传统支持向量机最优分类面分析的基础上,结合粒度计算(granular computing, GrC)理论,针对数据规模和分布密度不平衡的数据集,提出一种基于粒度偏移因子的粒度支持向量机(granular SVM, GSVM)学习方法,称为S_GSVM方法.该方法将原始样本用Mercer核映射到高维空间,然后在高维空间中对数据进行有效的粒划分,通过对不同的粒计算不同的超平面偏移因子,重新构造支持向量机的凸二次优化问题,以得到一个泛化能力更好的分类超平面.S_GSVM方法充分考虑了数据复杂分布对于泛化能力的影响,对基于最大间隔的分类面进行改进.实验结果表明,S_GSVM方法在非平衡数据集上能得到较好的泛化性能.  相似文献   

18.
A dynamic classification using the support vector machine (SVM) technique is presented in this paper as a new ‘incremental’ framework for multiple-classifying video stream data. The contribution of this study is the derivation of a unique, fast and simple to implement technique that allows multi-classification of behavioral motions based on an adaptation of the least-square SVM (LS-SVM) formulation. This dynamic approach leads to an extension of SVM beyond its current static image-based learning capabilities. The proposed incremental multi-classification method is applied to video stream data, which consists of an articulated humanoid model monitored by a surveillance camera. The initial supervised off-line learning phase is followed by a visual behavior data acquisition and then an incremental learning phase. The resulting error rate and the confidence level for the proposed technique demonstrate its validity and merits in articulated motion learning. Furthermore, the enabled online learning allows an adaptive domain knowledge insertion and provides the advantage of reducing both the model training time and the information storage requirements of the overall system which are both essential for dynamic soft computing applications.  相似文献   

19.
Granular computing serves as a general framework for complex problem solving in broad scopes and at various levels. The granularity was constructed via many ways, however, for complex systems there remain two challenges including determining a reasonable granularity and extracting the hierarchical information. In this paper, a new method is presented for constructing the optimal hierarchical structure based on fuzzy granular space. Firstly, the inter-class deviations and intra-class deviations were introduced, whose properties were investigated in depth and approved mathematically. Secondly, the fuzzy hierarchical evaluation index is developed, followed with a novel model for extracting the global optimal hierarchical structure established. An algorithm is then proposed, which reliably constructs the multi-level structure of complex system. Finally, to reduce the complexity, the granular signatures are extracted according to the nearest-to-center principle; with the use of the signatures, a classifier is designed for verifying our method. The validation of this method is approved by an application to the H1N1 influenza virus system. The theories and methodologies on granular computing presented here are helpful for capturing the structural information of complex system, especially for data mining and knowledge discovery.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号