首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
罗帆  蒋瑜 《计算机应用研究》2024,41(4):1047-1051
针对现有邻域粗糙集模型中存在属性权重都相同,无法保证关键属性在属性约简时能够被保留的问题,提出了一种基于信息熵加权的属性约简算法。首先,采用了类间熵、类内熵策略,以最大化类间熵最小化类内熵为原则给属性赋予权重;其次,构造了基于加权邻域关系的加权邻域粗糙集模型;最后,基于依赖关系评估属性子集的重要性,从而实现属性约简。在基于UCI数据集上与其他三种属性约简算法进行对比实验,结果表明,该算法能够有效去除冗余,提高分类精度。  相似文献   

2.
尽管极限学习机因具有快速、简单、易实现及普适的逼近能力等特点被广泛应用于分类、回归及特征学习问题,但是,极限学习机同其他标准分类方法一样将最大化各类总分类性能作为算法的优化目标,因此,在实际应用中遇到数据样本分布不平衡时,算法对大类样本具有性能偏向性。针对极限学习机类不平衡学习问题的研究起步晚,算法少的问题,在介绍了极限学习机类不平衡数据学习研究现状,极限学习机类不平衡数据学习的典型算法-加权极限学习机及其改进算法的基础上,提出一种不需要对原始不平衡样本进行处理的Adaboost提升的加权极限学习机,通过在15个UCI不平衡数据集进行分析实验,实验结果表明提出的算法具有更好的分类性能。  相似文献   

3.
针对协同训练方法在迭代时选择加入的无标记样本所隐含的有用信息不够,以及协同训练方法多个分类器标记不一致带来错误标记无标记样本的问题,提出了一种结合半监督聚类和加权[K]最近邻的协同训练方法。该方法在每次迭代过程中,先对训练集进行半监督聚类,选择隶属度高的无标记样本给朴素贝叶斯分类,再用加权[K]最近邻算法对多个分类器分类不一致的无标记样本重新分类。利用半监督聚类能够选择出较好表现数据空间结构的样本,而采用加权[K]最近邻算法为标记不一致的无标记样本重新标记能够解决标记不一致带来的分类精度降低问题。在UCI数据集上的对比实验验证了该算法的有效性。  相似文献   

4.
分析了利用支持向量回归求解多分类问题的思想,提出了一种基于局部密度比权重设置模型的加权最小二乘支持向量回归模型来单步求解多分类问题:该方法先分别对类样本中每类样本利用局部密度比权重设置模型求出每个样本的权重隶属因子,然后运用加权最小二乘支持向量回归算法对所有样本进行训练,获得回归分类器。为验证算法的有效性,对UCI三个标准数据集以及一个随机生成的数据集进行实验,对比了多种单步求解多分类问题的算法,结果表明,提出的模型分类精度高,具有良好的鲁棒性和泛化性能。  相似文献   

5.
传统的KNN算法存在分类效率低等缺点.针对这些缺点,本文提出一种高效的结合多代表点思想的加权KNN算法,利用变精度粗糙集上下近似区域的概念,结合聚类算法生成代表点集合构造分类模型,再运用结构风险最小化理论优化分类模型并对影响分类模型的因素进行分析.分类过程中根据测试样本与各代表点的相似度,得到测试样本的相对位置.其中属于样本点下近似区域的测试样本可直接判断其类别.若测试样本在其他区域,则根据测试样本与各代表点的相对位置对各代表点覆盖范围内的样本进行加权后判断测试样本的类别.在文本分类领域的数据集上进行实验,结果表明该算法能有效的提高分类模型的性能.  相似文献   

6.
针对Web中文文本分类中现有权重计算方法的不足和SVM算法对大数据量模式分类的低效性,提出了基于粗糙集约简并且加权的SVM分类方法。粗糙集作为SVM分类的前期预处理器,应用粗糙集的约简理论和基于Web中文文本的可变精度粗糙集加权方法对分类前的数据分别进行简化并计算权重,从而提高SVM后期分类的效率和精度。实验结果表明,SVM对约简并加权后的数据进行分类,分类性能得到了进一步保证。  相似文献   

7.
面对大量样本特征时很多分类器无法取得较好的分类效果,样本数有限导致贝叶斯算法无法获得精确的联合概率分布估计,在样本局部构建高质量分类器需要有效的样本相似性度量指标. 针对以上问题,提出了一种基于余弦相似度进行实例加权改进的朴素贝叶斯分类算法. 算法考虑特征对分类的决策权重不同,使用余弦相似度度量样本的相似性,选出最优训练样本子集,用相似度值作为训练样本的权值来训练修正后的贝叶斯模型进行分类. 基于UCI数据集的对比实验结果表明,提出的改进算法易于实现且具有更高的平均分类准确率.  相似文献   

8.
针对K-means聚类算法容易陷入局部最优、不能处理边界对象及线性不可分的缺点,提出一种基于粒子群的粗糙核聚类算法。该算法通过Mercer核将输入样本空间中的样本映射到高维空间,使样本变得线性可分,并结合粗糙集的思想,通过动态改变上下近似集的权重因子对边界对象进行有效处理,同时采用reliefF方法对样本属性进行加权处理,以解决混合数据的聚类问题,最后利用粒子群算法防止算法陷入局部最优。仿真实验表明,相对于其他改进算法,该算法具有较高的正确率和较短的收敛时间,并进一步验证了该算法的鲁棒性和稳定性,具有一定的实用价值。  相似文献   

9.
为提高极限学习机在失衡数据中的整体分类性能,提出一种基于代价敏感学习的自适应加权极限学习机分类算法。考虑各类间样本的差异性和同一类内样本的丰富性,利用类样本数量差异构造初始惩罚权重,分析样本附近异类样本数量确定额外代价权重,将两种代价权重相加构建自适应代价敏感惩罚矩阵。在公共数据集上的一系列对比实验结果表明,采用的自适应加权策略兼顾了不同类别样本的分布,在不平衡数据集上有效提高了算法整体分类精度。  相似文献   

10.
标记传播是使用最广泛的半监督分类方法之一。基于共识率的标记传播算法(Consensus Rate-based Label Propagation,CRLP)通过汇总多个聚类方法以合并数据各种属性得到的共识率来构造图。然而,CRLP算法与大多数基于图的半监督分类方法一样,在图中将每个标记样本视为同等重要,它们主要通过优化图的结构来提高算法的性能。事实上,样本不一定是均匀分布的,不同的样本在算法中的重要性也是不同的,并且CRLP算法容易受聚类数目和聚类方法的影响,对低维数据的适应性不足。针对这些问题,文中提出了一种基于加权样本和共识率的标记传播算法(Label Propagation Algorithm Based on Weighted Samples and Consensus-Rate,WSCRLP)。WSCRLP算法首先对数据集进行多次聚类,以探索样本的结构,并结合共识率和样本的局部信息构造图;然后为不同分布的标记样本分配不同的权重;最后基于构造的图和加权样本进行半监督分类。在真实数据集上的实验表明,WSCRLP算法对标记样本进行加权和构造图的方法可以显著提高分类准确率,在84%的实验中都优于对比方法。相比CRLP算法,WSCRLP算法不仅具有更好的性能,而且对输入参数具有鲁棒性。  相似文献   

11.
基于加权关联规则的个性化推荐研究   总被引:2,自引:0,他引:2  
关联规则是个性化推荐系统中最重要的技术手段之一.传统的基于关联规则的个性化推荐认为,每个项目都具有相同的重要性,在实际应用中缺乏一定的针对性.在New-Apriori算法的加权支持度基础上结合Fp-growth算法思想,提出了基于Fp-树的加权关联规则算法.在实验中采用网页被用户选择的频率作为权重值,在个性化推荐系统中对该算法进行了实现.实验结果表明该算法具有较高的准确性和效率.  相似文献   

12.
闫林  高伟  闫硕 《计算机科学》2017,44(9):261-265, 299
为了研究数据合并问题,并使合并数据保持合并前的数据之间的关联关系,对各类数据信息给予了结构化的表示,对应产生了由数据集和加权关系组合构成的加权关联结构;进而通过数据集的合并粒化集,完成了加权关联结构向加权粒化结构的转换,使数据集中的数据依据粒化信息得到了合并,并保持或汇集了合并前的数据之间的关联信息,由此形成了数据合并的结构粒化方法。在此基础上,构建了加权关联矩阵和加权粒化矩阵,分别作为加权关联结构和加权粒化结构的矩阵表示。经中间变换和目标变换的矩阵计算,实现了加权关联矩阵向加权粒化矩阵的变换,产生了与结构粒化等价的矩阵变换方法,形成了程序设计的算法基础。  相似文献   

13.
Weighted SVM在蛋白质磷酸化位点预测中的应用   总被引:1,自引:0,他引:1  
Weighted SVM是标准SVM针对非均衡样本的改进。首次将Weighted SVM用于蛋白质磷酸化位点的预测,在最新版的蛋白质磷酸化数据集PhosphoBase上,取得了目前为止最好的分类精度。k-fold交叉验证和独立测试集实验的结果表明,通过对样本数相对较少的正样本赋予较大的惩罚参数,Weighted SVM有效地改善了分类器向负样本方向的“偏斜”,提高了总的预测正确率以及(正样本)查全率。  相似文献   

14.
Using a “summable” dichotomy and fixed-point theorems, we prove the existence of convergent and bounded solutions of nonlinear difference systems.  相似文献   

15.
In this paper, we strengthen two recent undecidability results about weighted timed automata, an extension of timed automata with cost variables. More precisely, we propose new encodings of a Minsky machine that only require three clocks and one stopwatch cost, while previous reductions required five clocks and one stopwatch cost.  相似文献   

16.
This paper proposes a new ranking method for fuzzy numbers, which uses a defuzzification of fuzzy numbers and a weighting function. Following Saeidifar and Pasha (2008), first, we define a weighted distance measure on fuzzy numbers, and then, by minimizing this distance, the weighted interval and point approximations of fuzzy numbers are obtained. These indices are applied to rank the fuzzy numbers. This method is new and interesting for ranking fuzzy numbers, and it can be applied for solving and optimizing engineering and economics problems in a fuzzy environment.  相似文献   

17.
Earlier research by Kanet [11] has provided a number of new theorems for deciding precedence between pairs of jobs for 1∣∣ΣwjTj. The theorems supplant those of Rinnooy Kan, Lageweg, and Lenstra [16]. Presented here are the results of an analysis of the marginal benefit these new theorems provide over the earlier versions of Rinnooy Kan et al. Results show that the new theorems can provide noteworthy improvements in the ability to discover precedence relations between job pairs. For a large set of problem instances the new theorems uncovered up to 8% more precedence relations than the original theorems of Rinnooy Kan et al. The improvement in the productivity in discovering precedence relations shows to be dependent on the coefficient of variation of the distribution of job weights. Logical application of the theorems is to include them in search procedures and/or heuristic approaches to 1||ΣwjTj. One such heuristic based on the theorems is provided here in which the solutions to a large set of sample problems are within 8–12% of the optimum.  相似文献   

18.
We introduce a weighted logic with discounting and we establish the Büchi–Elgot theorem for weighted automata over finite words and arbitrary commutative semirings. Then we investigate Büchi and Muller automata with discounting over the max-plus and the min-plus semiring. We show their expressive equivalence with weighted MSO-sentences with discounting. In this case our logic has a purely syntactic definition. For the finite case, we obtain a purely syntactically defined weighted logic if the underlying semiring is additively locally finite.  相似文献   

19.
This paper considers the problem of scheduling n non-preemptive jobs on a single processor. Each job may have different size and weight. The objective is to minimize the weighted waiting time variance (WWTV). It is shown that the proof of one previous established optimality property in the literature, called “agreeably weighted property”, is wrong and the corrected proof is presented. Additional optimality properties are proved for the cases where job sizes are directly or inversely proportional to their weights, respectively. In addition, we show that the objective function of the problem can be expressed as a function of positional weights and processing times. With this new functional form, the proofs of several previously established optimality properties in the literature become rather straightforward.  相似文献   

20.
《国际计算机数学杂志》2012,89(1-4):343-358
Fuzzy grammars on Boolean lattices (B-fuzzy grammars) are newly defined and their basic properties are investigated. B-fuzzy grammars are defined as the extension of fuzzy grammars by Lee and Zadeh, where the grades of the application of rewriting rules of B-fuzzy grammars are the elements of Boolean lattice rather than the elements of unit interval [0,1].

It is shown that type 2 B-fuzzy grammars can generate type 1 languages though type 2 fuzzy grammars cannot generate type 2 languages. And the closure properties of B-fuzzy grammars are also studied.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号