期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张健沛程丽丽杨静马骏《计算机科学》2008,35(3):188-190

AdaB00st采用级联方法生成各基分类器,较好地体现了分类器之间的差异性和互补性.其存在的问题是,在迭代的后期,训练分类器越来越集中在某一小区域的样本上,生成的基分类器体现不同区域的分类特征.根据基分类器的全局分类性能得到固定的投票权重,不能体现基分类器在不同区域上的局部性能差别.因此,本文基于Ada-Boost融合方法,利用待测样本与各分类器的全信息相关度描述基分类器的局部分类性能,提出基于全信息相关度的动态多分类器融合方法,根据各分类器对待测样本的局部分类性能动态确定分类器组合和权重.仿真实验结果表明,该算法提高了融合分类性能. 相似文献

2.

基于改进的有监督保局投影人脸识别算法

下载免费PDF全文

高雷李晓东《计算机工程与应用》2011,47(17):185-187

为了充分利用样本的类别信息,提出了一种改进的有监督保局投影人脸识别算法。利用先验类标签信息重新构造传统保局投影算法中的权重矩阵,基于改进后的保局投影算法得到变换矩阵;用线性鉴别的思想筛选出变换矩阵中的最优基向量,构成最终的变换矩阵。把训练样本和测试样本投影到由最优基向量构成的子空间得到训练样本和测试样本的特征。采用最近邻分类器分类。在ORL和FERET人脸库上的测试结果表明,算法具有较好的识别性能。相似文献

3.

基于区域划分的kNN文本快速分类算法研究 总被引：1，自引：1，他引：0

胡元石冰《计算机科学》2012,39(10):182-186

kNN方法作为一种简单、有效、非参数的分类方法,在文本分类中广泛应用。为提高其分类效率,提出一种基于区域划分的kNN文本快速分类算法。将训练样本集按空间分布情况划分成若干区域,根据测试样本与各区域之间的位置关系快速查找其k个最近邻,从而大大降低kNN算法的计算量。数学推理和实验结果均表明,该算法在确保kNN分类器准确率不变的前提下,显著提高了分类效率。相似文献

4.

基于随机森林和欠采样集成的垃圾网页检测

卢晓勇陈木生《计算机应用》2016,36(3):731-734

为解决垃圾网页检测过程中的不平衡分类和"维数灾难"问题,提出一种基于随机森林(RF)和欠采样集成的二元分类器算法。首先使用欠采样技术将训练样本集大类抽样成多个子样本集,再将其分别与小类样本集合并构成多个平衡的子训练样本集;然后基于各个子训练样本集训练出多个随机森林分类器;最后用多个随机森林分类器对测试样本集进行分类,采用投票法确定测试样本的最终所属类别。在WEBSPAM UK-2006数据集上的实验表明,该集成分类器算法应用于垃圾网页检测比随机森林算法及其Bagging和Adaboost集成分类器算法效果更好,准确率、F1测度、ROC曲线下面积(AUC)等指标提高至少14%,13%和11%。与Web spam challenge 2007 优胜团队的竞赛结果相比,该集成分类器算法在F1测度上提高至少1%,在AUC上达到最优结果。相似文献

5.

数据流选择性集成的两阶段动态融合方法

下载免费PDF全文

杨显飞张健沛杨静《计算机工程》2011,37(20):180-182

选择性集成分类算法虽能提高集合分类器在整体数据集上的分类性能,但针对某一具体数据进行分类时,其选择出的个体分类器集合并不一定是最优组合。为此,从数据自适应角度出发,提出一种数据流选择性集成的两阶段动态融合方法,利用待分类数据所在特征空间中的位置,动态选择个体分类器集合,并对其进行分类。理论分析和实验结果表明,与GASEN算法相比,该方法的分类准确率更高。相似文献

6.

基于知识线记忆的多分类器集成算法

于思皓郭嘉丰范意兴兰艳艳程学旗《计算机学报》2021,44(3):462-475

多分类器系统作为混合智能系统的分支,集成了具有多样性的分类器集合,使整体得到更优的分类性能.结果融合是该领域中的一个重要问题,在相同分类器成员下,好的融合策略可以有效提升系统整体的分类正确率.随着模型安全性得到重视,传统融合策略可解释性差的问题凸显.本文基于心理学中的知识线记忆理论进行建模,参考人类决策过程,提出了一种拥有较好可解释性的启发式多分类器集成算法,称为知识线集成算法.该算法模拟人类学习与推断的行为,组织多分类器结果的融合.在训练中,模型收集给定分类器集合的不同子集,构建不同特征空间到解空间的映射,构成知识线.在推断时,模型启发式地激活知识线,进行选择性结果集成,得到推断结果.知识线集成使用样本驱动的模式,易于进行中间过程与最终结果的分析.以决策树作为分类器的实验表明,在相同的决策树集合下,知识线集成算法分类正确率与随机森林相仿.在此基础之上,知识线集成算法可量化问题不同粒度下的难易程度,且在推断时能提供相关训练样本作为依据. 相似文献

7.

基于正交投影的分类器算法

王卫东苗帅杨静宇《计算机科学》2011,38(5):190-193

提出了一种新颖的基于正交投影的分类器算法。该算法将测试样本正交投影到由各类训练样本生成的子空间中,并计算测试样本到各子空间的距离,以此作为分类的依据。该算法不需要计算样本协方差矩阵的逆阵,因此特别适合于小样本问题。在ORL人脸库上的实验结果表明,该算法的模式识别率高于传统分类器方法。相似文献

8.

一种新的有监督保局投影人脸识别算法 总被引：4，自引：3，他引：1

刘敏李晓东王振海《计算机应用》2009,29(5):1416-1422

为了充分利用样本的类别信息,提出了一种新的有监督保局投影人脸识别算法（NSLPP）。首先,把类间散布矩阵融入到传统保局投影算法的目标函数中,修改目标函数,并基于新的目标函数得到变换矩阵;然后用线性鉴别的思想筛选出变换矩阵中的最优基向量,构成最终的变换矩阵,把训练样本和测试样本投影到有最优基向量构成的子空间得到训练样本和测试样本的特征;最后采用最近邻分类器分类,在ORL和FERET人脸库上的测试结果表明,NSLPP算法具有较好的识别性能。相似文献

9.

基于免疫克隆特征选择和欠采样集成的垃圾网页检测

卢晓勇陈木生吴政隆张百栈《计算机应用》2016,36(7):1899-1903

为解决垃圾网页检测过程中的“维数灾难”和不平衡分类问题,提出一种基于免疫克隆特征选择和欠采样（US）集成的二元分类器算法。首先,使用欠采样技术将训练样本集大类抽样成多个与小类样本数相近的样本集,再将其分别与小类样本合并构成多个平衡的子训练样本集;然后,设计一种免疫克隆算法遴选出多个最优的特征子集;基于最优特征子集对平衡的子样本集进行投影操作,生成平衡数据集的多个视图;最后,用随机森林（RF）分类器对测试样本进行分类,采用简单投票法确定测试样本的最终类别。在WEBSPAM UK-2006数据集上的实验结果表明,该集成分类器算法应用于垃圾网页检测：与随机森林算法及其Bagging和AdaBoost集成分类器算法相比,准确率、F1测度、AUC等指标均提高11%以上;与其他最优的研究结果相比,该集成分类器算法在F1测度上提高2%,在AUC上达到最优。相似文献

10.

基于子模式的Gabor特征融合的单样本人脸识别 总被引：5，自引：0，他引：5

王科俊邹国锋《模式识别与人工智能》2013,26(1):50-56

针对传统人脸识别方法在单训练样本条件下效果不佳的缺点,提出基于子模式的Gabor特征融合方法并用于单样本人脸识别.首先采用Gabor变换抽取人脸局部信息,为有效利用面部器官的空间位置信息,将Gabor人脸图像分块构成子模式,采用最小距离分类器对各子模式分类.最后对各子模式分类结果做决策级融合得出分类结果.根据子模式构成原则和决策级融合策略不同,提出两种子模式Gabor特征融合方法.利用ORL人脸库和CAS-PEAL-R1人脸库进行实验和比较分析,实验结果表明文中方法有效提高单样本人脸识别的正确率,改善单样本人脸识别系统的性能. 相似文献

11.

Multiple classifiers combination by clustering and selection

《Information Fusion》2001,2(3):163-168

This paper proposes a novel algorithm for multiple classifiers combination based on clustering and selection technique (called M3CS), which can find in the feature space the regions where each classifier has best classification performance. The proposed method may be divided into two steps: clustering and selection (operation). At clustering step, the feature space is partitioned into several regions by clustering separately the correctly and incorrectly classified training samples from each classifier, and the performances of the classifier in each region are calculated. In the selection step, the most accurate classifier in the vicinity of the input sample is nominated to provide the final decision of the committee. The performance comparison between M3CS and Kuncheva's CS+DT method, as well as some simple aggregation methods such as maximum, minimum, average, and majority vote, confirms the validity of the proposed scheme. 相似文献

12.

基于特征选择及Condensing技术的文本取样

郝秀兰陶晓鹏王述云徐和祥胡运发《模式识别与人工智能》2009,22(5)

作为一种基于实例的方法,k-近邻(kNN)分类器有大量的计算及存储需求.同时,训练数据分布的不均衡,也会导致kNN分类器的性能下降.针对这些缺陷,文中提出特征选择与Condensing技术相结合的取样方法,以达到下述目的.在减少kNN分类的计算量及存储量的同时,保证分类器的性能.首先由传统的特征选择方法产生训练集里每类训练数据的特征.再根据文档自身的类特征,结合Condensing策略移去多余的训练实例.大量实验表明,用该方法所取得的样本作为训练集,不仅极大减少kNN方法的时空开销,而且降低噪声,提高分类器性能. 相似文献

13.

Method of classifier selection using the genetic approach

Konrad Jackowski Michal Wozniak 《Expert Systems》2010,27(2):114-128

Abstract: The paper presents a novel machine learning algorithm used for training a compound classifier system that consists of a set of area classifiers. Area classifiers recognize objects derived from the respective competence area. Splitting feature space into areas and selecting area classifiers are two key processes of the algorithm; both take place simultaneously in the course of an optimization process aimed at maximizing the system performance. An evolutionary algorithm is used to find the optimal solution. A number of experiments have been carried out to evaluate system performance. The results prove that the proposed method outperforms each elementary classifier as well as simple voting. 相似文献

14.

基于句类向量空间模型的自动文本分类研究 总被引：2，自引：0，他引：2

下载免费PDF全文

张运良张全《计算机工程》2007,33(22):45-47

向量空间模型是自动文本分类中成熟的文本表示模型，通常以词语或短语作为特征项，但这些特征项通常只能提供较少的局部语义信息。为实现基于内容的文本分类，该文用HNC理论中的句类作为特征项，通过混合句类分解等技术对句类向量空间降维，使用tfc算法对特征项进行权重计算，用KNN算法进行分类。该分类器的平均准确率和召回率都是可接受的，对类别的抽象程度无要求，即抽象度较高和较低的类别可以同时分类。通过使用更好的机器学习算法和其他的HNC语言理解技术，性能可以进一步提高。相似文献

15.

Emotional speech feature normalization and recognition based on speaker-sensitive feature clustering

Chengwei Huang Baolin Song Li Zhao 《International Journal of Speech Technology》2016,19(4):805-816

In this paper we propose a feature normalization method for speaker-independent speech emotion recognition. The performance of a speech emotion classifier largely depends on the training data, and a large number of unknown speakers may cause a great challenge. To address this problem, first, we extract and analyse 481 basic acoustic features. Second, we use principal component analysis and linear discriminant analysis jointly to construct the speaker-sensitive feature space. Third, we classify the emotional utterances into pseudo-speaker groups in the speaker-sensitive feature space by using fuzzy k-means clustering. Finally, we normalize the original basic acoustic features of each utterance based on its group information. To verify our normalization algorithm, we adopt a Gaussian mixture model based classifier for recognition test. The experimental results show that our normalization algorithm is effective on our locally collected database, as well as on the eNTERFACE’05 Audio-Visual Emotion Database. The emotional features achieved using our method are robust to the speaker change, and an improved recognition rate is observed. 相似文献

16.

On-line multi-stage sorting algorithm for agriculture products

Shahar Laykin Victor Alchanatis Yael Edan 《Pattern recognition》2012,45(7):2843-2853

This paper presents an on-line multi-stage sorting algorithm capable of adapting to different populations. The sorting algorithm selects on-line the most appropriate classifier and feature subsets for the incoming population. The sorting algorithm includes two levels, a low level for population detection and a high level for classifier selection which incorporates feature selection. Population detection is achieved by an on-line unsupervised clustering algorithm that analyzes product variability. The classifier selection uses n fuzzy kNN classifiers, each trained with different feature combinations that function as input to a fuzzy rule-based decision system. Re-training of the n fuzzy kNN classifiers occurs when the rule based system cannot assign an existing classifier with high confidence level. Classification results for synthetic and real world databases are presented. 相似文献

17.

Recursive Partitioning Technique for Combining Multiple Classifiers

Windeatt Terry 《Neural Processing Letters》2001,13(3):221-236

Various methods of reducing correlation between classifiers in a multiple classifier framework have been attempted. Here we propose a recursive partitioning technique for analysing feature space of multiple classifier decisions. Spectral summation of individual pattern components in intermediate feature space enables each training pattern to be rated according to its contribution to separability, measured as k-monotonic constraints. A constructive algorithm sequentially extracts maximally separable subsets of patterns, from which is derived an inconsistently classified set (ICS). Leaving out random subsets of ICS patterns from individual (base) classifier training sets is shown to improve performance of the combined classifiers. For experiments reported here on artificial and real data, the constituent classifiers are identical single hidden layer MLPs with fixed parameters. 相似文献

18.

基于改进的RAKEL算法的心电图诊断分类

赵静韩京宇钱龙毛毅《计算机应用》2022,42(6):1892-1897

心电图（ECG）数据通常包含多种病症,而ECG诊断是一个典型的多标签分类问题。在多标签分类方法中,RAKEL算法将标签集随机分解为若干个大小为k的子集,并建立LP分类器进行训练;然而由于没有充分考虑标签间的相关性,LP分类器中容易产生一些标签组合所对应样本稀少的情况,从而影响预测性能。为了充分考虑标签间的相关性,提出一种基于贝叶斯网络的RAKEL算法BN-RAKEL。首先利用贝叶斯网络找到标签间的相关性,确定候选标签子集;然后对每个标签采用基于信息增益的特征选择算法确定其最优特征空间,并针对每个候选标签子集利用最优特征空间相似性来检测其相关程度,以确定最终的具有强相关性的标签子集;最后在标签子集的最优特征空间上训练LP分类器。在实际的ECG数据集上,与多标签K近邻（ML-KNN）、RAKEL、CC和基于FP-Growth的RAKEL算法FI-RAKEL进行对比,结果显示所提算法在召回率和F-score上最少提高了3.6个百分点和2.3个百分点。实验结果表明,BN-RAKEL算法有较好的预测性能,能有效提升ECG诊断的准确性。相似文献

19.

可扩展的花卉种类识别

下载免费PDF全文

苗金泉曹卫群《中国图象图形学报》2014,19(11):1630-1638

目的基于模式识别的花卉种类识别方法在使用不同特征或分类器时识别准确率有较大差别。本文的研究目的在于实现花卉种类识别方法的快速构建及性能评估,减轻研究人员的编程工作量,提高效率。方法根据使用模式识别技术进行花卉种类识别的一般步骤,应用插件技术将算法中的预处理、特征提取、分类器训练、分类器识别等步骤表示成不同种类的处理器,建立可扩展的系统平台,研究人员可以通过修改各步骤所使用的处理器来修改图像处理和识别算法,并在此基础上采用流式链接方法构建算法。结果基于本文所提出的构建方法进行算法优化,并将其用于68种花卉的识别,准确率Top1为 91.26%,Top5为98.41%。结论流式链接方法能够对识别方法进行快速装配,有利于快速评估不同特征和分类器在花卉种类识别中的性能,适于算法的研究和优化。本文所提出的基于工作流式链接方法以及插件技术的构建方法具有灵活易用的特点,所构建的算法具有良好的可扩展性。该方法还可以推广应用于其他基于数字图像的模式识别算法研究。相似文献

20.

Fisher大间距线性分类器

下载免费PDF全文

陈才扣杨静宇《中国图象图形学报》2007,12(12):2143-2147

作为一种著名的特征抽取方法,Fisher线性鉴别分析的基本思想是选择使得Fisher准则函数达到最大值的向量(称为最优鉴别向量)作为最优投影方向,以便使得高维输入空间中的模式样本在该向量投影后,在类间散度达到最大的同时,类内散度最小。大间距线性分类器是寻找一个最优投影矢量(最优分隔超平面的法向量),它可使得投影后的两类样本之间的分类间距(Margin)最大。为了获得更佳的识别效果,结合Fisher线性鉴别分析和大间距分类器的优点,提出了一种新的线性投影分类算法——Fisher大间距线性分类器。该分类器的主要思想就是寻找最优投影矢量wbest(最优超平面的法向量),使得高维输入空间中的样本模式在wbest上投影后,在使类间间距达到最大的同时,使类内离散度尽可能地小。并从理论上讨论了与其他线性分类器的联系。在ORL人脸库和FERET人脸数据库上的实验结果表明,该线性投影分类算法的识别率优于其他分类器。相似文献