共查询到20条相似文献,搜索用时 15 毫秒
1.
基于错误驱动算法组合分类器及其在问题分类中的应用 总被引:3,自引:0,他引:3
开放领域问答系统(QA)能够给用户提供相对简洁、准确的结果,越来越受到人们的关注.问题分类把问题分成若干语义类型,是QA系统的一个重要的模块,它的准确性直接影响到QA系统的性能.为提高分类器性能,在问题分类任务中使用了集成学习方法,并且实验比较了词汇、句法、同义词集等不同的分类特征及错误驱动、投票法、BP神经网络等分类器集成方法,通过采用基于错误驱动集成分类器,用规则方法TBL作为统计方法SVM的补充;利用来自Wordnet的同义词集和名词的上位概念及Minipar的依存关系等语言知识作为分类特征,在公开测试集中取得了更高的分类精度. 相似文献
2.
交通标志识别是智能汽车或移动机器人自动导航的重要组成部分,由于现实环境中的交通标志存在着光照变化、褪色污损、扭曲变形等问题,使得同一类交通标志的模式分布呈现非高斯形态。为此,我们构造了一种非参数统计分类模型来识别交通标志。它对具有高度离散的模式识别问题有较好的适应性。实验表明这种分类模型用来识别特征高度离散的交通标志是有效的。 相似文献
3.
交通标志识别是智能汽车或移动机器人自动导航的重要组成部分,由于现实环境中的交通标志存在着光照变化、褪色污损、扭曲变形等问题,使得同一类交通标志的模式分布呈现非高斯形态.为此,我们构造了一种非参数统计分类模型来识别交通标志.它对具有高度离散的模式识别问题有较好的适应性.实验表明这种分类模型用来识别特征高度离散的交通标志是有效的. 相似文献
4.
为验证理论训练数量(10~30 p)对参数分类器(如最大似然分类)、非参数分类器(如支撑向量机)的适用性以及样本特征(光谱统计、空间分布特征)对分类器分类精度的影响,选择不同规模的训练样本进行最大似然分类和支撑向量机分类,分析分类精度与样本之间的关系。实验结果表明:随着样本量的增加,最大似然、支撑向量机分类精度均随样本量增多而提高并趋于稳定,最大似然分类精度的增长速度要快于支撑向量机。MLC受样本量的影响较大,在小样本的时候(5个),分类精度不稳定,超过30个样本的时候,分类精度稳定下来;对于SVM分类器,在小样本的时候(5个),分类精度较高且稳定,因此SVM分类适合于小样本分类,不受限于理论样本量的影响。当样本量超过最小理论样本量值(30个)的时候,最大似然分类精度要优于支撑向量机,主要是由于当样本量增加后,最大似然更易于获得有效的信息量样本,而对于支撑向量机边缘信息样本的增加数量不大。研究结果为进一步优化样本进行分类打下前期的实验基础。 相似文献
5.
This paper suggests a nonparametric method for stochastic volatility estimation and its comparison with other widespread econometric algorithms. A major advantage of this approach is that the volatility can be estimated even in the case of its completely unknown probability distribution. As demonstrated below, the new method has better characteristics against the popular parametric algorithms based on the GARCH model and Kalman filter. 相似文献
6.
1 引言近年来,多分类器的组合方法已成为模式识别研究的热点问题,并已在模式识别的多个应用方面,如字符识别、目标识别、文本分类等领域获得了较好的应用效果。多分类器组合方法的基本假设是:对一个需要专家进行的任务,k个专家个人判断的有效组合应该优于个人的判断。利用具有不同特性和性能的多分类器,通过进行有效的组合可以获得更高的模式识别性能。 相似文献
7.
Chunhua Shen Peng Wang Sakrapee Paisitkriangkrai Anton van den Hengel 《International Journal of Computer Vision》2013,103(3):326-347
Cascade classifiers are widely used in real-time object detection. Different from conventional classifiers that are designed for a low overall classification error rate, a classifier in each node of the cascade is required to achieve an extremely high detection rate and moderate false positive rate. Although there are a few reported methods addressing this requirement in the context of object detection, there is no principled feature selection method that explicitly takes into account this asymmetric node learning objective. We provide such an algorithm here. We show that a special case of the biased minimax probability machine has the same formulation as the linear asymmetric classifier (LAC) of Wu et al. (linear asymmetric classifier for cascade detectors, 2005). We then design a new boosting algorithm that directly optimizes the cost function of LAC. The resulting totally-corrective boosting algorithm is implemented by the column generation technique in convex optimization. Experimental results on object detection verify the effectiveness of the proposed boosting algorithm as a node classifier in cascade object detection, and show performance better than that of the current state-of-the-art. 相似文献
8.
With the development of internet, web mining has become a hotspot of data mining. The first step of web mining is to classify web pages into interesting classes, so the classification is one of the essential techniques for web mining. In this paper, we study the capabilities of bayesian classifiers for web pages categorization, after that we report our work on the comparison of binary-classification and multi-classification. Results on benchmark dataset show that bayesian classifiers perform satisfying, especially for Hidden Naive Bayes (HNB) which is more competitive than other methods. Furthermore, the performances of binary-classification are better than those of multi-classification under the evaluation metrics of accuracy and F-measure. 相似文献
9.
Patterns Based Classifiers 总被引:1,自引:0,他引:1
Data mining is one of the most important areas in the 21 century for its applications are wide ranging. This includes medicine,
finance, commerce and engineering, to name a few. Pattern mining is amongst the most important and challenging techniques
employed in data mining. Patterns are collections of items which satisfy certain properties. Emerging Patterns are those whose
frequencies change significantly from one dataset to another. They represent strong contrast knowledge and have been shown
very successful for constructing accurate and robust classifiers. In this paper, we examine various kinds of patterns. We
also investigate efficient pattern mining techniques and discuss how to exploit patterns to construct effective classifiers. 相似文献
10.
11.
In this paper we present several Bayesian algorithms for learning Tree Augmented Naive Bayes (TAN) models. We extend the results in Meila & Jaakkola (2000a) to TANs by proving that accepting a prior decomposable distribution over TAN’s, we can compute the exact Bayesian model averaging over TAN structures and parameters in polynomial time. Furthermore, we prove that the k-maximum a posteriori (MAP) TAN structures can also be computed in polynomial time. We use these results to correct minor errors in Meila & Jaakkola (2000a) and to construct several TAN based classifiers. We show that these classifiers provide consistently better predictions over Irvine datasets and artificially generated data than TAN based classifiers proposed in the literature.Editors: Pedro Larrañaga, Jose A. Lozano, Jose M. Peña and Iñaki Inza 相似文献
12.
13.
Programming and Computer Software - A method of stance detection in text is proposed. This method is based on the machine learning of ensembles of classifiers. It is known that ensembles have... 相似文献
14.
本文介绍了一类可用于分类器融合的泛组合逻辑算子,同时作为方法论基础研究了基于案例学习的泛逻辑运算符(算子)构造和选择方法,并以此构造分类器的融合器,实验数据集选择了UCI的spam数据集,并同其他融合方法进行了对比。结果表明本文所述方法具有较低的错误率和相应较高的查全率。 相似文献
15.
人脸检测是自动人脸识别系统的基础.为提高人脸的检测速度,采用一种基于两级分类器和支持向量机的人脸检测方法.该方法中,第一级分类器采用特征基方法,对待检测区域进行粗筛选,过滤掉大量非人脸背景信息,然后在剩余区域,用第二级分类器支持向量机进行验证,若是人脸,给出标识.支持向量机有效克服了神经网络中可能遇到的局部极小值和过学习问题,是统计学习理论的基础上新发展起来的机器学习算法.实验结果表明该算法提高了检测速度,系统更有效率. 相似文献
16.
粒的表示、粒之间的关系和运算是粒计算的主要研究内容。利用向量表示超盒粒, 分析向量之间的偏序关 系和超盒粒之间的偏序关系的不一致性, 并引入保序函数消除该不一致性。利用格和其对偶格之间的非线性正评价函数和保序函数构造超盒粒之间模糊包含关系。为得到不同粒度的粒, 设计超盒粒之间的合并算子和分解算子, 证明由超盒粒集、超盒粒之间的模糊包含关系、合并算子、分解算子构成的代数系统是模糊格, 构造基于模糊格的超盒粒计算分类器。用机器学习数据集中的分类问题, 验证该分类器具有和模糊格推理分类器相同的推广能力并减少超盒粒的数量。 相似文献
17.
人脸识别技术拥有广泛的应用前景,但是目前不少实现方式存在一些不尽人意之处。在对OPENCV与SVM分类器进行分析的基础上,阐述了基于两级分类器的人脸检测方法的原理和实现过程,首先分析了两级分类器的构建,引入人脸图像的矩形特征向量,将图像的矩形特征作为分类的依据,随后论述了系统设计与实现,包括灰度变换过程、直方图均衡过程、图像平滑过程以及金字塔序列化的实现。这种检测模式能够加快处理速度,提升效率。 相似文献
18.
为了获得准确的人体姿态识别结果,满足智能视频监控的需求,提出一种融合Hu不变矩特征和傅里叶描述子特征的人体姿态识别算法,并将ReliefF算法引入特征选择过程中,区分特征的重要性,然后使用大数投票法构建多分类器投票机制进行姿态识别,该机制很好地发挥了各个分类器的优势,提高了识别的准确率。实验结果表明,提出的算法对各种姿态取得了很好的分类效果。 相似文献
19.
论文提出了一种基于专家域的多层分类器融合模型,专家指不同专长之单分类器。模型思想来自医院诊断流程,模型首先训练n个专家,之后将样本空间按专家专长划分专家域。对于待测样本,先将样本指派到合适的专家域,然后再由指定的专家对样本进行分类。用这种算法对UCI的标准数据集进行分类,实验结果显示,该算法得到比其他算法更低的分类误差,显著提高了分类器的性能。 相似文献
20.
入侵检测实质上是分类问题,即将正常数据同入侵行为分开.在本文中,提出一种双层入侵检测算法,算法的一层是基于Boosting的入侵检测算法,二层是SVM算法.KDD CUP99数据集用于实验中,结果表明,基于这种结构的双层入侵检测算法分类精度和泛化能力都好于单个神经网络和常用神经网络集成方法. 相似文献