首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
并行免疫克隆特征选择算法   总被引:1,自引:0,他引:1  
针对模式识别中传统的封装式特征选择算法,难以得到较好的特征子集和复杂度较高的分类器评价特征子集的耗时问题,提出了一种用于特征选择的并行免疫克隆算法,采用免疫克隆算法搜索特征,并利用并行算法评价特征子集,即将种群中个体的适应度计算并行在多个计算节点上同时进行.将该算法在Linux刀片集群上基于MPICH软件对UCI数据集进行特征子集选择算法仿真,特征子集采用最近邻分类并采用留一法验证评价.结果表明该算法选出的特征子集优于经典的顺序浮动前向搜索算法和标准遗传算法,与串行算法运行时间相比,在40个CPU时其加速比最高可达29.57.  相似文献   

2.
提出了一种新的股票时间序列相似性的研究方法,该方法与已往的算法相比,具有很高的计算效率.首先将时间序列分段线性化,将近似直线的端点按时间顺序排列形成转折点序列来描述原始序列,从而降低了数据的数量和复杂度,提高了快速性.基于分段线性化,提出了一种相似性计算方法,可以从时间序列中搜索用于传统股票分析的基础模型.将基础模型的谷点和峰点的位置按照某种规律重新排序,然后从转折点序列中寻找重新排序后与基础模型排序相同的子序列(即相似性搜索),用该基础模型可以对股票后续趋势做出预测.与通常的相似性算法相比,该算法不考虑时间尺度和数据的幅值的变化,因此,大大提高了相似性的计算精度.  相似文献   

3.
基于随机森林的特征选择算法   总被引:2,自引:0,他引:2  
提出了一种基于随机森林的封装式特征选择算法RFFS,以随机森林算法为基本工具,以分类精度作为准则函数,采用序列后向选择和广义序列后向选择方法进行特征选择。在UCI数据集上的对比实验结果表明,RFFS算法在分类性能和特征子集选择两方面具有较好的性能。  相似文献   

4.
针对柔性作业车间调度问题并结合其求解的特点,提出一种以最大完工时间最小化为目标的自适应遗传差分进化算法。在种群初始化过程中引入GLR初始化方法,有效改善机器选择部分初始解的质量;提出一种新的自适应交叉变异概率公式改进交叉和变异函数,并运用遗传算法的精英保留+轮盘赌策略,结合“贪婪思想”的差分进化的选择策略,使算法的搜索逐渐走向最优解;通过经典算例仿真以及与传统遗传算法结果的比较,证明改进算法在最大完工时间和收敛速度上的优化,验证了改进算法的可行性和有效性。  相似文献   

5.
提出一种基于马氏距离的分段矢量量化时间序列分类(Mahalanobis distance-based time series classification using PVQA, MPVQA)算法。该算法在继承传统算法时间复杂度的基础上,引入马氏距离,克服了欧氏距离容易受模式特征量纲影响的缺点,提高了算法精度。首先,在训练时采用分段矢量量化近似方法获得码本,然后以马氏距离为相似性度量对时间序列进行分段重构。对重构后的时间序列,同样基于马氏距离为相似性度量进行判别。在4个时间序列数据集上进行的试验结果验证了所提方法在时间序列表示和分类上的优越性。  相似文献   

6.
序列最小化算法(SMO)是支持向量机重要的常用分解方法。而工作集的选择是实现序列最小优化算法的关键。通过重写KKT条件,提出了一种改进的新工作集选择方法,并相应提出最小化步骤。通过将改进的支持向量机方法应用于网络用户行为数据的分析,与现有方法进行对比测试,验证了新工作集选择方法将减少支持向量机的学习时间并加快收敛过程,改进的支持向量机方法在运行效率和准确度上都有不同程度的提高。  相似文献   

7.
将并行计算的策略引入到时间序列处理中,提出基于Map/Reduce的时间序列相似性搜索算法,充分利用云计算可进行大规模计算和数据处理的特点,有效降低了时间序列相似性搜索中运算量,简化了计算过程。该算法在心电图数据集上进行相似性搜索,分别进行PAA下界过滤和DTW距离的计算,验证运算时间和并行加速比随节点变化的情况,与传统的单机运算相比,有效地提高了时间序列挖掘效率。  相似文献   

8.
利用双堆栈降低时间复杂度的新算法   总被引:1,自引:1,他引:0  
分析了由树的前序序列和中序序列建树问题的递归算法的最坏时间复杂度和平均时间复杂度,以及利用哈希表改进查找得到的算法的时间复杂度;提出了利用两个堆栈构造的新算法,并证明其最坏时间复杂度与平均时间复杂度均为O(n)。  相似文献   

9.
针对特征选择过程中准确率和计算效率不平衡问题,提出了一种快速特征选择框架(FFFS).基于该框架,使用最小冗余最大相关方法(MRMR)选择候选特征,借助序列前向选择方法(SFS)验证性能,并通过限定迭代次数提高计算性能.与MRMR、SFS和混合序列浮动前向选择算法(FDHSFFS)的对比实验结果表明,提出的快速特征选择算法MRMR-SFS能在预测准确率和计算效率之间取得较好的平衡.  相似文献   

10.
在分析车辆路线问题(VRP)现有启发式算法的基础上,提出了求解该问题的一种改进遗传算法(IGA)。该方法的核心在于针对遗传算法的局部搜索能力的不足,在选择、交叉、变异等遗传操作之后,引入逆转换位算子,根据适应度是否增加,对新产生的染色体进行多次逆转操作。模拟计算结果表明,该改进遗传算法明显增强了群体演化的质量,提高了算法收敛速度。  相似文献   

11.
特征选择是生物信息领域中数据预处理阶段必不可少的步骤。传统特征选择算法忽视了特征之间的依赖相关性和冗余性,因此提出一种联合互信息的特征选择算法(JFRR)。该算法利用互信息计算特征之间的冗余值,并利用联合互信息分别计算已选特征集合、候选特征及类标签之间的相关性。将JFRR与其他6个特征选择算法在2个分类器上,使用9个不同基因数据集,进行分类准确率指标(Precision_micro和F1_micro)验证。实验结果表明,该算法能有效提高分类精度。  相似文献   

12.
一种新的混合特征选择方法RRK   总被引:2,自引:1,他引:1  
提出一种新的基于包装方法和过滤器方法的混合特征选择算法RRK。该算法主要包括两个方面:①在特征预选阶段,提出一种基于ReliefF算法的特征加权算法NReliefF和降维算法DR,以实现特征加权并去掉不太重要的特征;②在特征选择阶段,把NReliefF算法和KNN算法结合起来,将预选特征作为输入,用分类正确率来选择最优特征。分别采用一个实际的乘员类型数据集和UCI上的imagine标准数据集进行了实验。实验结果表明,采用RRK后分类的效率和正确率都有明显提高。  相似文献   

13.
DNA N6甲基腺嘌呤(6mA)是DNA中一种重要的甲基化修饰,参与生物学许多调控过程,在生物过程中起着重要的作用.文章用了公开的小鼠数据集进行研究,首先对小鼠的基因序列(A、T、C、G)通过数学表示符进行信息编码,然后采用卡方检验的方法对编码信息进行特征筛选,筛选出6mA位点相关的特征进行下一步的研究,最后用了7种机器学习算法构建分类模型,并采用五折交叉验证(5-Fold Cross-Validation)对预测结果进行验证,结果显示在使用滑动窗口编码方式下选取前20个最优特征作为训练集样本特征,其随机森林模型对于小鼠6mA位点预测准确率可达到1.  相似文献   

14.
王晨曦    刘园奎    吕彦    林耀进   《南京师范大学学报》2022,(4):009-18
在实际应用领域中,存在许多特征空间无法预先给定的场景,数据以特征流的形式随时间动态流入特征空间,而样本数量是固定不变的. 同时,数据的类别中往往存在丰富的层次化结构关系,传统的特征选择算法在性能上已无法满足需求. 基于此,本文提出一种面向层次分类学习的在线流特征选择算法. 首先,利用兄弟节点之间的关系设计了一种基于最大近邻的决策误差率计算公式. 其次,设计在线重要性选择和在线冗余更新两种在线评估准则,用于选择决策误差最小的特征子集. 最后,在6个层次数据集上的实验结果表明,所提算法优于一些现有的在线流特征选择算法.  相似文献   

15.
由于运动想象脑电信号的信噪比较低,特征提取和特征选择比较困难,无法获得较高的分类准确率.针对上述问题,该文提取了时域、频域和空间域3个观察面的特征,并采用粒子群优化算法结合随机森林分类器来进行特征筛选.具体过程为,首先根据R2图来对信号进行带通滤波;其次,使用小波软阈值和得分共空间模式算法进行去噪和通道筛选;然后,通过...  相似文献   

16.
In learning and classification problems, feature selection (FS) is critical in finding features that are both meaningful and non-redundant. Today, big data is an integral aspect of all industry sectors. All firms in any industry, such as power, finance, commerce, electronics, communications, and so on, create massive amounts of heterogeneous data that needed to be handled effectively and evaluated correctly. When it comes to big data, feature selection approaches are taken as game-changer since they can assist in minimizing the complexity of genetic data, making it simpler to study and translating it into meaningful information. To enhance classification performance, feature selection is done to remove unnecessary and redundant characteristics from the dataset. In this paper, we presented a novel Grey Wolf Approach based on Quantum leaping neighbor memeplexes which is termed QLGWONM for feature selection and reduction to achieve better classification accuracy. The paper implemented other optimization algorithms such as particle swarm optimization (PSO), slime mould algorithm (SMA), salp swarm algorithm (SSA), artificial butterfly algorithm (ABA), whale optimization (WO), crow search optimization algorithm (CSA), and Jaya models. After the implementation of these algorithms, QLGWONM outperformed other algorithms. The QLGWONM model performed well with an accuracy of 100% for Brain Tumor, CNS, Lung dataset and 97.1% for Ionosphere dataset, and 99% for NSL-KDD. Apart from these, some state-of-art comparisons were also evaluated and QLGWONM gave better results as compared with other existing algorithms.  相似文献   

17.
To address the problem of data fusion between monocular camera image with 3D data from laser detection and ranging (LADAR) sensor, this paper proposes a novel simplified scheme based on the planar feature method, which can meet the accuracy requirements of the joint calibration with fewer checkerboard calibration plate (CP) positions than traditional methods. First, a mathematical model of the joint calibration is established to obtain the calibration parameters. Secondly, the selection of positions and orientations of the CP are introduced and the corresponding influence to the calibration is analyzed. Then, the calibration result is optimized by using a nonlinear Levenberg-Marquardt (LM) optimization approach, and the distance residual method is utilized to estimate the accuracy. Finally, experimental results conclude that the minimum number of positions required to meet the joint calibration accuracy in the proposed method is 5, which is less than 12 in traditional methods.  相似文献   

18.
针对带钢表面缺陷人工检测方法效率低下的问题,设计了一套在线自动检测系统.首先,提出了带钢表面缺陷在线检测系统的总体设计方案,包括系统的硬件结构、软件结构以及图像采集系统.随后,着重研究了在线检测系统中所涉及的图像预处理方法、图像分割方法、特征提取选择和缺陷分类方法.通过缺陷区域频率域图像特征的提取和缺陷的人工神经网络分类,提高了分类结果的准确性.最后,采用常见缺陷的样本对该系统进行测试,实验结果验证了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号