首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
提出了利用相似粗糙集进行范例提取的算法,自动从原始数据中提取典型范例并能获得较高的分类精度.该算法能较好的处理噪声的干扰,减少预设参数的数量,并能直接处理连续数值型属性,避免了复杂的属性离散化的计算.实验结果验证了算法的可行性和有效性.  相似文献   

2.
基于范例推理中的一种范例匹配方法模型   总被引:1,自引:0,他引:1  
传统的最近邻检索和匹配算法不一定能找到最优相似范例,本文提出了一种根据范例间数值型属性对应成比例的原则进行范例匹配的方法,它作为原算法的一个补充,为找到最优相似范例提供了一条有效途径.  相似文献   

3.
杨金红  李居朋 《测控技术》2014,33(8):153-156
为提高通信对抗中语音干扰程度,设计并实现了一种电话语音加扰系统,核心处理器是TMS320VC5502,语音采集模块是TLV320AIC23B,语音控制模块是C8051F320和WT588D。该系统充分利用TMS320VC5502的高速处理数据的能力和MCU语音控制能力,从而满足复杂算法处理和语音干扰的实现。软件算法方面,针对语音干扰,提出了一种方法,即利用基于人耳听觉感知特性的MFCC提取语音特征参数,然后RASTA处理,最后利用欧氏距离找出相似语音进行干扰。与传统的噪声干扰相比,该系统具有实时性高、功耗低、体积小、重量轻、操作方便、干扰相关性好、可懂度低等特点,具有实际的应用价值。  相似文献   

4.
为了提高煤矿井下图像的视觉效果,提出一种改进的基于相似度测量的增强算法和模糊熵理论相结合的方法.根据煤矿井下图像的特点,引入模糊熵,建立基于模糊熵测度的判别准则,尽量去除噪声干扰.改进隶属度函数的计算方法,充分提取图像中的分形维特征信息.通过改进对比度变换因子的计算方法,进一步增强图像局部对比度.实验结果表明,处理后的图像不会出现增强过度现象,具有较好地噪声抑制、明暗对比和保持图像细节,是一种有效地矿井图像增强方法.  相似文献   

5.
一种有效的用于范例提取的改进聚类算法   总被引:8,自引:0,他引:8  
针对传统范例提取算法随范例教增加而效率下降快的缺点,结合基于选择的CLARA聚类方法和NCL聚类算法的优点,给出了一种有效的无监督聚类学习算法.通过实验表明,该算法能在无监督下对范例进行准确归类,将它用于CBR的范例提取中,能大大地提高范例提取的速度和质量。  相似文献   

6.
为满足现代社会对气象预警预报服务的需求,研发了Android系统平台下实时天气预测和异常天气预警系统。根据决策树算法中的C4.5算法,解决天气预警分类问题。该方法通过提取训练样本中最大增益率属性作为属性特征建立决策树,经剪枝后得到天气预警评估的决策树模型,并对此模型进行分析和应用。实验结果表明这种方法在分类评估准确率上具有优势,分类正确率达到85.8%.  相似文献   

7.
一种基于概念相似度的数据分类方法   总被引:7,自引:0,他引:7  
依据数据属性间的相似信息,提出了一种分类方法.该方法将属性矢量化,属性作为m维空间的基本矢量,数据记录作为属性矢量的和.利用属性间先验的概念相似信息,给出了求取任意属性矢量对的相似距离算法,并将数据间相关度计算转换为属性矢量及其相互投影的公式,从而得到任意两条数据的相关度;利用相关度,提出了一种分类算法.用详实的实验证明了该算法的有效性.  相似文献   

8.
基于分辨相似矩阵的相似粗糙集的属性约简算法   总被引:4,自引:2,他引:2  
针对现实中数据局限导致等价关系弱化为相似关系,用相似关系代替等价关系建立了相似粗糙集的理论,定义了新的分辨相似矩阵,并给出了基于分辨相似矩阵的求核和属性约简算法,该算法可以有效地减少属性约简的计算量,最后通过实例验证了该算法是适用和有效的。  相似文献   

9.
针对现有数据复原汇聚算法的复原汇聚精度低和对网络噪声干扰的稳健性差等不足,提出了一种基于相似度的无线传感器网络数据复原汇聚算法。该算法在分布式数据汇聚模型的基础上,利用重心距离和相关系数来衡量各簇节点感知数据的受攻击程度,并把两者统一在加权系数中,通过加权运算提高了算法的数据复原汇聚精度。此外,利用相关系数对噪声干扰敏感的特点提高了算法对网络噪声干扰的稳健性。理论分析和仿真结果表明,新算法的性能优于现有数据复原汇聚算法。  相似文献   

10.
提出了一种基于相似度的网格聚类算法(SGCA)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用边界点阈值函数提取类的边界点,最后利用相似度方法进行聚类。SGCA算法只要求对数据集进行一遍扫描。实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好的识别出孤立点或噪声,它不仅适用于综合数据集,而且对高维数据集也具有较好的聚类结果。本文中还引进了网格核技术,进一步改善了SGCA算法的时间复杂度。  相似文献   

11.
针对传统K近邻分类器在大规模数据集中存在时间和空间复杂度过高的问题,可采取原型选择的方法进行处理,即从原始数据集中挑选出代表原型(样例)进行K近邻分类而不降低其分类准确率.本文在CURE聚类算法的基础上,针对CURE的噪声点不易确定及代表点分散性差的特点,利用共享邻居密度度量给出了一种去噪方法和使用最大最小距离选取代表点进行改进,从而提出了一种新的原型选择算法PSCURE (improved prototype selection algorithm based on CURE algorithm).基于UCI数据集进行实验,结果表明:提出的PSCURE原型选择算法与相关原型算法相比,不仅能筛选出较少的原型,而且可获得较高的分类准确率.  相似文献   

12.
In this article we discuss automated preprocessing of environmental data for further use. Environmental data is by default heterogeneous, as it may consist of data from sources such as weather stations, weather radars, chemical sensors, acoustic sensors, and off-line laboratory analysis. When integrating data from such heterogeneous sources, it needs to be processed in a context dependent manner. In addition, there is no single generic processing method; rather, several atomic methods need to be applied and in an appropriate sequence. Furthermore, the problem is complicated by the requirements set by the intended use of the data. The requirements influence not only the set of applicable methods but also the application sequence. In this article, we study automation of the selection and sequencing of preprocessing methods based on the user requirements. As the main contribution, we propose here the use of characterizations and a reachability algorithm to solve the selection and sequencing problem. In this article, we present the algorithm and argue for its correctness. We also discuss, how the algorithm is implemented as a cloud service, and illustrate the use of the service with simple case studies.  相似文献   

13.
地图及工程图纸的智能矢量化方法   总被引:2,自引:0,他引:2  
针对常规矢量化几何失真较明显,抗噪声干扰能力弱等不足,本文提出了基于骨架点对划进行跟踪,通过设定规划库进行噪声滤除和形状校正的智能矢量化方法。本方法在矢量化各环节分别采用了动态模板定位骨架点;根据典型噪声和失真的知识,设计准则自动进行噪声滤除和形状校正;利用最大距离法进行矢量化等方法,以克服典型的噪声和干扰。  相似文献   

14.
鞅在学习样本选择中的应用   总被引:1,自引:0,他引:1  
样本训练集的选取对网络分类精度及泛化能力有很大影响,同样对回归分析中的两难问题“偏差-方差”影响很大。经典的简单抽样理论在现实中很难做到,数据之间关系受到噪音以及领域知识的限制而显得很复杂,尤其是离群点的影响不能忽视。故而有限样本集中学习,如何获得最优结果不仅与算法有关,且与样本集的选取有关。文章首先从学习的数学理论出发阐明样本训练集的选取方法必要性,进而提出样本选择的鞅性要求与样本训练集中的离群点定义,最后提出在无监督学习中,混合密度分布有限样本集且样本类别数不知情形下的聚类与离群点判别算法,试验结果表明该算法的可行性与有效性。  相似文献   

15.
针对无监督属性选择算法使用单一方法,未考虑数据间内在相关性和噪声等问题,提出一种基于属性自表达的低秩无监督属性选择算法。算法首先将稀疏正则化([l2,1-]范数)引入属性自表达损失函数中实现无监督稀疏学习,其次在系数矩阵中加入低秩约束以降低噪声和离群点的影响,然后利用低秩结构和图拉普拉斯正则化使子空间学习兼顾数据的全局和局部结构,最后通过属性自表达实现无监督学习。经数据集上多次迭代验证,该算法能够快速收敛并达到全局最优,与SOGFS、PCA、LPP、RSR等四种算法相比分类准确率平均提高了16.11%、14.03%、9.92%和4.2%,并且在各数据集上互信息平均值也是最高的,说明该算法有效、高效。  相似文献   

16.
算法选择实际上可视为一种学习任务.鉴于此,首先分析基于元学习思想的算法选择框架;然后从数据集特征和元算法两个角度对基于元学习思想的算法选择方法进行归纳总结;最后分析基于元学习思想的算法选择存在的问题,并指出未来发展方向.  相似文献   

17.
The focus of this paper is on joint feature re-extraction and classification in cases when the training data set is small. An iterative semi-supervised support vector machine (SVM) algorithm is proposed, where each iteration consists both feature re-extraction and classification, and the feature re-extraction is based on the classification results from the previous iteration. Feature extraction is first discussed in the framework of Rayleigh coefficient maximization. The effectiveness of common spatial pattern (CSP) feature, which is commonly used in Electroencephalogram (EEG) data analysis and EEG-based brain computer interfaces (BCIs), can be explained by Rayleigh coefficient maximization. Two other features are also defined using the Rayleigh coefficient. These features are effective for discriminating two classes with different means or different variances. If we extract features based on Rayleigh coefficient maximization, a large training data set with labels is required in general; otherwise, the extracted features are not reliable. Thus we present an iterative semi-supervised SVM algorithm embedded with feature re-extraction. This iterative algorithm can be used to extract these three features reliably and perform classification simultaneously in cases where the training data set is small. Each iteration is composed of two main steps: (i) the training data set is updated/augmented using unlabeled test data with their predicted labels; features are re-extracted based on the augmented training data set. (ii) The re-extracted features are classified by a standard SVM. Regarding parameter setting and model selection of our algorithm, we also propose a semi-supervised learning-based method using the Rayleigh coefficient, in which both training data and test data are used. This method is suitable when cross-validation model selection may not work for small training data set. Finally, the results of data analysis are presented to demonstrate the validity of our approach. Editor: Olivier Chapelle.  相似文献   

18.
陶剑文 《计算机工程》2007,33(15):207-208,
为提高支持向量回归算法的学习能力和泛化性能,提出了一种优化支持向量回归参数的混合选择算法.根据训练样本的规模和噪声水平等信息,确定支持向量回归参数的取值范围,用实数编码的免疫遗传算法搜索最佳参数值.混合选择算法具有较高的精度和效率,在选择支持向量回归参数时,不必考虑模型的复杂度和变量维数.仿真实验结果表明,该算法是选择支持向量回归参数的有效方法,应用到函数逼近问题时具有优良的性能.  相似文献   

19.
王强  陈英武  邢立宁 《计算机工程》2007,33(15):40-42,6
为提高支持向量回归算法的学习能力和泛化性能,提出了一种优化支持向量回归参数的混合选择算法。根据训练样本的规模和噪声水平等信息,确定支持向量回归参数的取值范围,用实数编码的免疫遗传算法搜索最佳参数值。混合选择算法具有较高的精度和效率,在选择支持向量回归参数时,不必考虑模型的复杂度和变量维数。仿真实验结果表明,该算法是选择支持向量回归参数的有效方法,应用到函数逼近问题时具有优良的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号