共查询到19条相似文献,搜索用时 187 毫秒
1.
提出了利用相似粗糙集进行范例提取的算法,自动从原始数据中提取典型范例并能获得较高的分类精度.该算法能较好的处理噪声的干扰,减少预设参数的数量,并能直接处理连续数值型属性,避免了复杂的属性离散化的计算.实验结果验证了算法的可行性和有效性. 相似文献
2.
基于范例推理中的一种范例匹配方法模型 总被引:1,自引:0,他引:1
传统的最近邻检索和匹配算法不一定能找到最优相似范例,本文提出了一种根据范例间数值型属性对应成比例的原则进行范例匹配的方法,它作为原算法的一个补充,为找到最优相似范例提供了一条有效途径. 相似文献
3.
为提高通信对抗中语音干扰程度,设计并实现了一种电话语音加扰系统,核心处理器是TMS320VC5502,语音采集模块是TLV320AIC23B,语音控制模块是C8051F320和WT588D。该系统充分利用TMS320VC5502的高速处理数据的能力和MCU语音控制能力,从而满足复杂算法处理和语音干扰的实现。软件算法方面,针对语音干扰,提出了一种方法,即利用基于人耳听觉感知特性的MFCC提取语音特征参数,然后RASTA处理,最后利用欧氏距离找出相似语音进行干扰。与传统的噪声干扰相比,该系统具有实时性高、功耗低、体积小、重量轻、操作方便、干扰相关性好、可懂度低等特点,具有实际的应用价值。 相似文献
4.
王利娟 《计算机工程与设计》2012,33(7):2696-2700
为了提高煤矿井下图像的视觉效果,提出一种改进的基于相似度测量的增强算法和模糊熵理论相结合的方法.根据煤矿井下图像的特点,引入模糊熵,建立基于模糊熵测度的判别准则,尽量去除噪声干扰.改进隶属度函数的计算方法,充分提取图像中的分形维特征信息.通过改进对比度变换因子的计算方法,进一步增强图像局部对比度.实验结果表明,处理后的图像不会出现增强过度现象,具有较好地噪声抑制、明暗对比和保持图像细节,是一种有效地矿井图像增强方法. 相似文献
5.
一种有效的用于范例提取的改进聚类算法 总被引:8,自引:0,他引:8
针对传统范例提取算法随范例教增加而效率下降快的缺点,结合基于选择的CLARA聚类方法和NCL聚类算法的优点,给出了一种有效的无监督聚类学习算法.通过实验表明,该算法能在无监督下对范例进行准确归类,将它用于CBR的范例提取中,能大大地提高范例提取的速度和质量。 相似文献
6.
为满足现代社会对气象预警预报服务的需求,研发了Android系统平台下实时天气预测和异常天气预警系统。根据决策树算法中的C4.5算法,解决天气预警分类问题。该方法通过提取训练样本中最大增益率属性作为属性特征建立决策树,经剪枝后得到天气预警评估的决策树模型,并对此模型进行分析和应用。实验结果表明这种方法在分类评估准确率上具有优势,分类正确率达到85.8%. 相似文献
7.
8.
9.
10.
提出了一种基于相似度的网格聚类算法(SGCA)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用边界点阈值函数提取类的边界点,最后利用相似度方法进行聚类。SGCA算法只要求对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好的识别出孤立点或噪声,它不仅适用于综合数据集,而且对高维数据集也具有较好的聚类结果。本文中还引进了网格核技术,进一步改善了SGCA算法的时间复杂度。 相似文献
11.
针对传统K近邻分类器在大规模数据集中存在时间和空间复杂度过高的问题,可采取原型选择的方法进行处理,即从原始数据集中挑选出代表原型(样例)进行K近邻分类而不降低其分类准确率.本文在CURE聚类算法的基础上,针对CURE的噪声点不易确定及代表点分散性差的特点,利用共享邻居密度度量给出了一种去噪方法和使用最大最小距离选取代表点进行改进,从而提出了一种新的原型选择算法PSCURE (improved prototype selection algorithm based on CURE algorithm).基于UCI数据集进行实验,结果表明:提出的PSCURE原型选择算法与相关原型算法相比,不仅能筛选出较少的原型,而且可获得较高的分类准确率. 相似文献
12.
In this article we discuss automated preprocessing of environmental data for further use. Environmental data is by default heterogeneous, as it may consist of data from sources such as weather stations, weather radars, chemical sensors, acoustic sensors, and off-line laboratory analysis. When integrating data from such heterogeneous sources, it needs to be processed in a context dependent manner. In addition, there is no single generic processing method; rather, several atomic methods need to be applied and in an appropriate sequence. Furthermore, the problem is complicated by the requirements set by the intended use of the data. The requirements influence not only the set of applicable methods but also the application sequence. In this article, we study automation of the selection and sequencing of preprocessing methods based on the user requirements. As the main contribution, we propose here the use of characterizations and a reachability algorithm to solve the selection and sequencing problem. In this article, we present the algorithm and argue for its correctness. We also discuss, how the algorithm is implemented as a cloud service, and illustrate the use of the service with simple case studies. 相似文献
13.
地图及工程图纸的智能矢量化方法 总被引:2,自引:0,他引:2
针对常规矢量化几何失真较明显,抗噪声干扰能力弱等不足,本文提出了基于骨架点对划进行跟踪,通过设定规划库进行噪声滤除和形状校正的智能矢量化方法。本方法在矢量化各环节分别采用了动态模板定位骨架点;根据典型噪声和失真的知识,设计准则自动进行噪声滤除和形状校正;利用最大距离法进行矢量化等方法,以克服典型的噪声和干扰。 相似文献
14.
鞅在学习样本选择中的应用 总被引:1,自引:0,他引:1
样本训练集的选取对网络分类精度及泛化能力有很大影响,同样对回归分析中的两难问题“偏差-方差”影响很大。经典的简单抽样理论在现实中很难做到,数据之间关系受到噪音以及领域知识的限制而显得很复杂,尤其是离群点的影响不能忽视。故而有限样本集中学习,如何获得最优结果不仅与算法有关,且与样本集的选取有关。文章首先从学习的数学理论出发阐明样本训练集的选取方法必要性,进而提出样本选择的鞅性要求与样本训练集中的离群点定义,最后提出在无监督学习中,混合密度分布有限样本集且样本类别数不知情形下的聚类与离群点判别算法,试验结果表明该算法的可行性与有效性。 相似文献
15.
针对无监督属性选择算法使用单一方法,未考虑数据间内在相关性和噪声等问题,提出一种基于属性自表达的低秩无监督属性选择算法。算法首先将稀疏正则化([l2,1-]范数)引入属性自表达损失函数中实现无监督稀疏学习,其次在系数矩阵中加入低秩约束以降低噪声和离群点的影响,然后利用低秩结构和图拉普拉斯正则化使子空间学习兼顾数据的全局和局部结构,最后通过属性自表达实现无监督学习。经数据集上多次迭代验证,该算法能够快速收敛并达到全局最优,与SOGFS、PCA、LPP、RSR等四种算法相比分类准确率平均提高了16.11%、14.03%、9.92%和4.2%,并且在各数据集上互信息平均值也是最高的,说明该算法有效、高效。 相似文献
16.
算法选择实际上可视为一种学习任务.鉴于此,首先分析基于元学习思想的算法选择框架;然后从数据集特征和元算法两个角度对基于元学习思想的算法选择方法进行归纳总结;最后分析基于元学习思想的算法选择存在的问题,并指出未来发展方向. 相似文献
17.
The focus of this paper is on joint feature re-extraction and classification in cases when the training data set is small.
An iterative semi-supervised support vector machine (SVM) algorithm is proposed, where each iteration consists both feature
re-extraction and classification, and the feature re-extraction is based on the classification results from the previous iteration.
Feature extraction is first discussed in the framework of Rayleigh coefficient maximization. The effectiveness of common spatial
pattern (CSP) feature, which is commonly used in Electroencephalogram (EEG) data analysis and EEG-based brain computer interfaces
(BCIs), can be explained by Rayleigh coefficient maximization. Two other features are also defined using the Rayleigh coefficient.
These features are effective for discriminating two classes with different means or different variances. If we extract features
based on Rayleigh coefficient maximization, a large training data set with labels is required in general; otherwise, the extracted
features are not reliable. Thus we present an iterative semi-supervised SVM algorithm embedded with feature re-extraction.
This iterative algorithm can be used to extract these three features reliably and perform classification simultaneously in
cases where the training data set is small. Each iteration is composed of two main steps: (i) the training data set is updated/augmented
using unlabeled test data with their predicted labels; features are re-extracted based on the augmented training data set.
(ii) The re-extracted features are classified by a standard SVM. Regarding parameter setting and model selection of our algorithm,
we also propose a semi-supervised learning-based method using the Rayleigh coefficient, in which both training data and test
data are used. This method is suitable when cross-validation model selection may not work for small training data set. Finally,
the results of data analysis are presented to demonstrate the validity of our approach.
Editor: Olivier Chapelle. 相似文献
18.
为提高支持向量回归算法的学习能力和泛化性能,提出了一种优化支持向量回归参数的混合选择算法.根据训练样本的规模和噪声水平等信息,确定支持向量回归参数的取值范围,用实数编码的免疫遗传算法搜索最佳参数值.混合选择算法具有较高的精度和效率,在选择支持向量回归参数时,不必考虑模型的复杂度和变量维数.仿真实验结果表明,该算法是选择支持向量回归参数的有效方法,应用到函数逼近问题时具有优良的性能. 相似文献