首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
任永功  林楠 《计算机科学》2009,36(6):188-191
在文本特征选择过程中,针对原始特征空间维数过高、计算量过大、并且存在较大不相关性和冗余性,提出了一种基于动态规划思想的文本特征选择算法(DPFS).首先,结合动态规划思想,基于特征与类别的相关性分析,对原始特征集合进行特征筛选,保留与类别具有强相关性和弱相关性的特征;然后,再次结合动态规划思想,对特征子集做冗余性分析,滤除弱相关且冗余的特征;最后,得到一个近似最优特征子集.实验结果表明,此算法在对数据降维和在降维过程中减少计算量是有效的.  相似文献   

2.
BioHashing是可撤销生物认证中广泛应用的身份认证方案,针对用户令牌泄露导致BioHashing识别性能严重退化的问题,提出一种改进的BioHashing指纹模板保护算法。该算法在量化过程中采用滑动窗口产生固定长度的二值序列,并结合滑动窗口带来的更大的密钥空间,有效提高了指纹特征自身的区分能力和安全性。理论分析和实验结果表明,改进方法产生的二值序列能有效保护指纹模板的原始特征信息,提高系统的识别性能。  相似文献   

3.
针对单一特征空间不足以对动态时变环境中跟踪目标进行准确表达的缺点,提出一种基于柔性加权特征的ParticleFilter目标跟踪算法。首先引入“陡峭因子”这一概念对不同特征的跟踪鉴别性能进行客观评估,然后参照当前不同特征的可跟踪性能以加权组合的方式自适应生成当前最优特征,最后将生成的最优特征嵌入到ParticleFilter跟踪构架中完成目标跟踪任务。该算法具备较高的柔性可对任意采用直方图表达的特征进行自适应融合。不同的视频序列实验表明该算法可动态地对异类特征进行有效融合,对复杂场景下的目标进行稳健跟踪。  相似文献   

4.
针对传统鲸鱼优化算法(WOA)不能有效处理连续型数据、邻域粗糙集对噪声数据的容错性较差等问题,文中提出基于自适应WOA和容错邻域粗糙集的特征选择算法.首先,为了避免WOA过早陷入局部最优,基于迭代周期构建分段式动态惯性权重,改进WOA的收缩包围和螺旋捕食行为,设计自适应WOA.然后,为了解决邻域粗糙集对噪声数据缺乏容错性的问题,引入邻域内相同决策特征所占的比例,定义容错邻域上下近似集、容错近似精度和近似粗糙度、容错依赖度及容错近似条件熵.最后,基于容错邻域粗糙集构造适应度函数,使用自适应WOA,不断迭代以获取最优子群.高维数据集上采用费雪评分算法进行初步降维,降低算法的时间复杂度.在8个低维UCI数据集和6个高维基因数据集上的实验表明,文中算法可有效选择特征个数较少且分类精度较高的特征子集.  相似文献   

5.
针对动作捕捉数据高维度、检索耗时问题,提出一种基于哈希学习的高效编码和快速检索算法.该算法对动作捕捉库中的每个运动序列,顺序将固定帧数的帧序列作为滑动窗口,以滑动窗口为单位抽取特征,将一个帧序列其所有滑动窗口特征作为其特征表达,通过哈希学习方法对每个序列进行哈希编码;检索时采用分层检索策略,对待检索序列提取其关键帧,用哈希编码方法检索库中与关键帧相似的若干窗口帧,并通过均匀帧采样计算帧间误差进一步筛选包含相似窗口帧的序列段,获得数据库中与待检索序列相似的若干相似序列段.实验结果表明,文中算法可实现从大规模动作捕捉数据库中快速检索相似序列段.  相似文献   

6.
为提高传统字典学习方法选用固定的语音分段长度重构源信号的精度,提出基于动态字典学习的欠定盲语音重构算法,以提取信号中最优的稀疏表示特征。在欠定语音盲分离的两步法框架下,利用正则化Sim CO字典学习对信号进行稀疏表示,依据最速下降思想通过改变语音分段长度迭代优化信号的重构结果直至收敛,得到信号恢复的总体最优解。实验结果表明,相较传统算法,动态Sim CO字典学习算法进一步提取了信号在字典稀疏域的语音特征,在保证运行成本低的同时有效提高了欠定盲语音的重构质量。  相似文献   

7.
李博  杨丹  邓林 《自动化学报》2011,37(6):665-673
针对移动机器人视觉闭环检测中,基于视觉字典本的场景外观表征性能受制于有限单词个数以及算法效率低的不足,本文对机器人视觉特征分层量化,构建视觉字典树, 计算树节点的TF-IDF熵作为对应视觉单词的权重,生成图像--单词逆向文档索引.为消除视觉字典本的单尺度量化误差,并克服基于字典树投影路径的平面匹配模式中不 区分不同层次节点的区分度对闭环检测的影响,本文融合字典树低层单词的强表征性和高层单词的强鲁棒性,提出由下而上逐层计算图像间相似性增量的金字塔得分匹 配方法.将不同时刻相似性大于阈值的图像位置提取为候选闭环,通过后验确认操作剔除误正闭环.在移动机器人视觉闭环检测实验中,本文算法提高了图像相似性计算 的效率和准确性,提高了闭环检测的准确率和召回率.  相似文献   

8.
魏池璇  王志海  原继东  林钱洪 《软件学报》2022,33(12):4411-4428
对于许多实际应用来说,获取多个不同窗口尺度上的模式,有助于发现时间序列的不同规律性特征.同时,通过对时间序列时域和频域两方面的分析,有助于挖掘更多的知识.提出了一种新的基于可变尺度的时域频域辨别性特征挖掘方法以及应用于分类的算法.主要采用了不同尺度窗口、符号聚合近似技术以及符号傅里叶近似技术等,以有效地发掘时间序列不同尺度时域频域模式;与此同时,使用统计学方法挖掘部分最具辨别性的特征用于时间序列分类,有效地降低了算法时间复杂度.在多个数据集上的对比实验结果,说明了该算法具有较高的准确率;在真实数据集上的解析,表明了该算法具有更强的可解释性.同时,该算法可扩展应用到多维时间序列分类问题中.  相似文献   

9.
针对不等长序列数据的关联问题,提出基于滑动窗口的最优匹配增权法不等长序列相似度度量算法。以较短序列作为滑动窗口遍历较长序列得到一组滑动相似度,利用这组相似度形成最优权重,加权得到不等长序列的相似度,并根据相似度大小对序列数据进行关联判决,以解决截断法相似度度量仅能反映截断序列局部相似度的问题。仿真实验验证了所提出算法对不等长序列数据关联的有效性,并对序列长度和量测误差等因素对相似度度量和关联效果的影响进行了讨论。  相似文献   

10.
时间序列相似性查找作为一种非平凡问题,大多数有效的求解方法都涉及到对原数据维度的简约。在有效地保持原序列中信息量的前提下,尽可能降低计算复杂度是算法的关键所在。通过讨论滑动窗口在时间序列相似性降维算法中的实际应用情况,从中发现一种自适应确定滑动窗口宽度的新方法。通过对时序特征值分布函数挖掘,发现时间序列中的有效特征点,进而确定一组合适的滑动窗口宽度;最后根据序列的变化情况来决定最优的滑动窗口宽度,对原数据维度进行简约。  相似文献   

11.
具有统计不相关性的最佳鉴别特征空间的维数定理   总被引:5,自引:1,他引:5  
提出并严格证明了具有统计不相关性的最佳鉴别特征空间的维数定理:对含有L个类别的模式识别问题,具有统计不相关性的最佳鉴别特征空间的维数为(L-1):说明了具有统计不相关性的最佳鉴别变的与Wilks所提出的经典的模式特征抽取方法的关系。在一定的条件下,具有统计不相害性的最佳鉴别矢量集等价于Wilks所提出的经典鉴别矢量集。经典的模式特征抽取方法可以用来在不损失任何Fisher鉴别信息的意义下,对含有L个类别的模式识别问题。抽取(L-1)个具有统计不相关性的最佳鉴别特征。  相似文献   

12.
在基于字典的单帧图像超分辨率重建算法中,依赖人工浅层特征设计的字典表达图像特征能力有限。为此,提出基于深度学习特征字典的超分辨重建方法。该算法首先利用深度网络进行高、低分辨率训练样本图像深层次特征学习;然后,在稀疏字典超分辨框架下联合训练特征字典;最后,输入单帧低分辨率图像并利用该字典实现超分辨率重建。理论分析表明,引入深度网络提取图像深层次特征并用于字典训练,对低分辨率图像的高频信息补充更加有利。实验证明,与双三次插值以及基于一般人工特征字典的超分辨重建算法相比,本文算法的主观视觉和客观评价指标均高于对比算法。  相似文献   

13.
Series feature aggregation for content-based image retrieval   总被引:1,自引:0,他引:1  
Feature aggregation is a critical technique in content-based image retrieval (CBIR) systems that employs multiple visual features to characterize image content. Most previous feature aggregation schemes apply parallel topology, e.g., the linear combination scheme, which suffer from two problems. First, the function of individual visual feature is limited since the ranks of the retrieved images are determined only by the combined similarity. Second, the irrelevant images seriously affect the retrieval performance of feature aggregation scheme since all images in a collection will be ranked. To address these problems, we propose a new feature aggregation scheme, series feature aggregation (SFA). SFA selects relevant images using visual features one by one in series from the images highly ranked by the previous visual feature. The irrelevant images will be effectively filtered out by individual visual features in each stage, and the remaining images are collectively described by all visual features. Experiments, conducted with IAPR TC-12 benchmark image collection (ImageCLEF2006) that contains over 20,000 photographic images and defined queries, have shown that the proposed SFA can outperform conventional parallel feature aggregation schemes.  相似文献   

14.
在地震发生前往往存在各种异常现象,而如何有效地提取震前异常信息是非常重要的研究课题。采用一种基于滑动窗口的几何移动平均鞅算法来进行震前异常特征提取。该算法将地震数据进行几何移动平均鞅处理和滑动窗口特征抽取后,能够有效地提取地震震前异常数据的特征。利用该算法对汶川地震和庐山地震震前的美国国家海洋和大气管理局(NOAA)卫星长波辐射信息进行了分析。实验结果表明该算法能够发现震中区域比周边区域存在更明显的异常,这些异常信号可以辅助研究人员在震前确定地震区域。  相似文献   

15.
杜政霖  李云 《计算机应用》2017,37(3):866-870
针对既有历史数据又有流特征的全新应用场景,提出了一种基于组特征选择和流特征的在线特征选择算法。在对历史数据的组特征选择阶段,为了弥补单一聚类算法的不足,引入聚类集成的思想。先利用k-means方法通过多次聚类得到一个聚类集体,在集成阶段再利用层次聚类算法对聚类集体进行集成得到最终的结果。在对流特征数据的在线特征选择阶段,对组构造产生的特征组通过探讨特征间的相关性来更新特征组,最终通过组变换获得特征子集。实验结果表明,所提算法能有效应对全新场景下的在线特征选择问题,并且有很好的分类性能。  相似文献   

16.
This paper proposes an optimal feature and parameter selection approach for extreme learning machine (ELM) for classifying power system disturbances. The relevant features of non-stationary time series data from power disturbances are extracted using a multiresolution S-transform which can be treated either as a phase corrected wavelet transform or a variable window short-time Fourier transform. After extracting the relevant features from the time series data, an integrated PSO and ELM architectures are used for pattern recognition of disturbance waveform data. The particle swarm optimization is a powerful meta-heuristic technique in artificial intelligence field; therefore, this study proposes a PSO-based approach, to specify the beneficial features and the optimal parameter to enhance the performance of ELM. One of the advantages of ELM over other methods is that the parameter that the user must properly adjust is the number of hidden nodes only. In this paper, a hybrid optimization mechanism is proposed which combines the discrete-valued PSO with the continuous-valued PSO to optimize the input feature subset selection and the number of hidden nodes to enhance the performance of ELM. The experimental results showed the proposed algorithm is faster and more accurate in discriminating power system disturbances.  相似文献   

17.
基于形态特征的数据流聚类方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
吴学雁  黄道平 《计算机工程》2011,37(13):46-48,51
在聚类过程中为保留数据的重要形态与趋势特征,提出一种基于形态特征的数据流聚类方法。在初始化阶段提取重要特征点表示序列分段,在在线更新阶段使用部分动态时间弯曲方法计算子序列距离,基于动态滑动窗口思想保证多条数据流中数据的同步,在用户触发聚类阶段提出数据流聚类方法。通过对仿真数据和实际股票数据的分析结果表明,在参数设置合理的情况下,该方法可以获得接近0.95的聚类演化精度。  相似文献   

18.
A good feature selection method should take into account both category information and high‐frequency information to select useful features that can effectively display the information of a target. Because basic mutual information (BMI) prefers low‐frequency features and ignores high‐frequency features, clustering mutual information is proposed, which is based on clustering and makes effective high‐frequency features become unique, better integrating category information and useful high‐frequency information. Time is an important factor in topic detection and tracking (TDT). In order to improve the performance of TDT, time difference is integrated into clustering mutual information to dynamically adjust the mutual information, and then another algorithm called the dynamic clustering mutual information (DCMI) is given. In order to obtain the optimal subsets to display topics information, an objective function is proposed, which is based on the idea that a good feature subset should have the smallest distance within‐class and the largest distance across‐class. Experiments on TDT4 corpora using this objective function are performed; then, comparing the performances of BMI, DCMI, and the only existed topic feature selection algorithm Incremental Term Frequency‐Inverted Document Frequency (ITF‐IDF), these performance information will be displayed by four figures. Computation time of DCMI is previously lower than BMI and ITF‐IDF. The optimal normalized‐detection performance (Cdet)norm of DCMI is decreased by 0.3044 and 0.0970 compared with those of BMI and ITF‐IDF, respectively.  相似文献   

19.
针对传统iBeacon指纹定位技术中接收信号强度值(RSSI)波动较大、指纹库聚类复杂、存在较大跳变性定位误差等问题,提出一种基于排序特征匹配和距离加权的蓝牙定位算法。在离线阶段,该算法先对RSSI进行加权滑动窗处理,然后根据RSSI向量大小生成排序特征码等值,并与位置坐标等信息组成指纹信息,形成指纹库;在在线定位阶段,根据排序特征向量指纹匹配定位算法和基于距离的最优加权K最邻近法(WKNN)实现室内行人定位。在定位仿真实验中,该算法可以自动根据特征码进行聚类,从而降低了聚类的复杂度,能实现最大误差在0.952 m内的室内行人定位精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号