首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 22 毫秒
1.
基于隐马尔可夫模型的文本分类算法   总被引:2,自引:0,他引:2  
杨健  汪海航 《计算机应用》2010,30(9):2348-2350
自动文本分类领域近年来已经产生了若干成熟的分类算法,但这些算法主要基于概率统计模型,没有与文本自身的语法和语义建立起联系。提出了将隐马尔可夫序列分析模型(HMM)用于自动文本分类的算法,首先构造表示文档类别的特征词集合,并以文档类别的特征词序列作为不同HMM分类器的观察序列,而HMM的状态转换序列则隐含地表示了不同类别文档内容的形成演化过程。分类时,具有最大生成概率的HMM分类器类标即为测试文档的分类结果。该算法构造的分类器模型一定程度上体现了不同类别文档的语法和语义特征,并可以实现多类别的自动文本分类,分类效率较高。  相似文献   

2.
针对传统中医诊断信息技术中,存在样本不平衡及面色识别精度低的问题,提出了基于改进粒子群算法的支持向量机(SVM)模型.由于数据量的限制,选择SVM小样本分类模型.采用粒子群算法为SVM模型选择合理参数.采用惯性权重先增后减的更新策略,同时利用自适应高斯模型对粒子群算法进行改进,应对容易陷入局部最优的问题.研究了384个...  相似文献   

3.
李强  陈浩  陈丁当 《计算机应用》2016,36(11):3212-3216
针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型;同时,为了适应语音信号的实时处理,降低了语音参数提取的复杂度,并对判决阈值提出改进,以保证语音信号帧间的相关性。在不同噪声环境下对改进算法进行性能测试并与自适应多速率编码(AMR)标准、国际电信联盟电信标准分局(ITU-T)的G.729B标准比较,测试结果表明,改进算法在实时语音信号处理中能够有效提高检测的准确率及噪声跟踪能力。  相似文献   

4.
This paper presents a new approach that uses the maximum model distance (MMD) method for the adaptation of hidden Markov models (HMMs). This method has the same framework as it is used for constructing speech recognizers with abundant data, and work effectively with any amount of adaptation data. All parameters of the HMMs with or without the adaptation data could be adapted. If the adaptation data is sufficient, then the adapted models will gradually become a speaker-dependent one. Both the dialect and the speaker adaptation experiments were conducted to investigate the effectiveness of the proposed algorithm. In the speaker adaptation experiments, up to 65.55% phoneme error reduction was achieved, and the MMD could reduce the phoneme error by 16.91% even only one adaptation utterance is available.  相似文献   

5.
以篦冷机关键参数篦下压力为研究对象,提出一种篦压变化趋势预测模型.利用主成分分析对数据降维,以主元序列作为观测序列,构建改进的多种群算法优化隐马尔可夫模型参数.种群内利用轮盘赌算子选择个体,设计双区与均匀行交叉结合的自适应交叉算子避免局部收敛,进行动态变异率的多项式变异操作提高收敛速度,种群间提出混合师生交流机制的自适应移民算子保证多种群协同进化.仿真表明本文算法可收敛到全局最优,能提高收敛精度和速度,利用该算法建立的模型跟踪性能好,预测精度高,能满足对篦压趋势预测的要求.  相似文献   

6.
基于PSO的模糊聚类算法   总被引:8,自引:3,他引:8  
提出了一种基于模糊C-均值算法和粒子群算法的混合聚类算法。该算法结合PSO的全局搜索和FCM局部搜索的特点,将PSO优化聚类结果作为后续FCM算法的初始值,有效地克服了FCM对初始值敏感、易陷入局部最优和PSO算法局部搜索较弱的问题,同时增强了跳出局部最优的能力。实验表明,新算法得到的目标函数值更小,并能减小分类错误率,聚类效果优于单一使用FCM或PSO。  相似文献   

7.
一种人工免疫算法优化的高有效性模糊聚类图像分割   总被引:1,自引:0,他引:1  
刘云龙  林宝军 《控制与决策》2010,25(11):1679-1683
针对传统模糊聚类初值敏感、易陷入局部最优的缺陷,将具有良好勘探和开采能力的人工免疫算法用于模糊聚类的优化并提出了相应的图像分割算法.利用改进的Hausdorff距离提出一种新的抗体浓度评价算子并定义了相应的免疫算子,简化了免疫操作,增强了算法自适应寻优能力.采用最近提出的一种有效性函数作为聚类适应度函数,以人工免疫算法寻优,从而自适应地确定聚类数日与中心,实现自动图像分割.仿真实验表明,该算法可以实现图像的自动高有效性分割.  相似文献   

8.
粒子群优化鱼群算法仿真分析   总被引:3,自引:0,他引:3  
针对标准粒子群算法(PSO)寻优多维多极值函数成功率低,基本人工鱼群算法(AFSA)收敛速度和精度有待提高等问题,提出粒子群优化鱼群算法(PSO-FSA)。该算法将速度惯性、个体记忆和个体间交流等特征引入鱼群算法,使鱼群行为模式扩充至追尾、聚群、记忆、交流以及觅食。此外,定义参数max D动态限定鱼群搜索的视野和步长。仿真分析表明,粒子群优化鱼群算法较两种基本算法而言具有更快的收敛速度和寻优精度。  相似文献   

9.
基于多模板隐马尔可夫模型的文本信息抽取算法   总被引:1,自引:0,他引:1  
由于训练数据来源的多样化,难以通过学习得到最优的模型参数,因此提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法。该算法首先利用文本排版格式和分隔符等信息,对文本进行分块;然后在分块的基础上,对训练数据进行聚类以形成多个形式的模板(多模板),并对多模板数据训练得到隐马尔可夫初始概率及转移概率参数;最后,用被训练的数据统一训练释放概率参数,结合初始概率、转移概率以及释放概率参数对文本信息进行抽取。实验结果表明,该算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能。  相似文献   

10.
传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数。提出了一种使用遗传算法优化HMM模型参数的Web信息抽取混合算法。该算法使用实数矩阵编码表示染色体,似然概率值为适应度取值,将GA与Baum-Welch算法相结合对HMM模型参数进行全局优化,并且调整GA-HMM的Baum-Welch算法参数实现Web信息抽取。实验结果表明,新的算法在精确度和召回率指标上比传统HMM具有更好的性能。  相似文献   

11.
阈值优化的文本密度聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对DBSCAN算法的聚类性能受全局阈值影响而降低的问题,提出一种阈值优化的文本密度聚类算法。该算法使用k-近邻距离对对象进行排序,通过分位数区分密度不同的各序列,找到与其对应的优化,根据优化阈值使用密度聚类方法对对象进行聚类。改进后的聚类算法克服了阈值选取对聚类结果影响的问题,提高了聚类精确度和时间效率。采用树形结构存储聚簇,增加了聚簇的可读性。实验结果证明了该算法的有效性。  相似文献   

12.
This paper considers two discrete time, finite state processes XX and YY. In the usual hidden Markov model XX modulates the values of YY. However, the values of YY are then i.i.d. given XX. In this paper a new model is considered where the Markov chain XX modulates the transition probabilities of the second, observed chain YY. This more realistically can represent problems arising in DNA sequencing. Algorithms for all related filters, smoothers and parameter estimations are derived. Versions of the Viterbi algorithms are obtained.  相似文献   

13.
Based on the recent research concerning the PageRank Algorithm used in the famous search engine Google [1], a new Inverse-PageRank-Particle Swarm Optimizer (I-PR-PSO) is presented in order to improve the performances of classic PSO. The resulted algorithm uses a stochastic Markov chain model to define an intelligent topological structure of the swarm’s population, in which the better particles have an important influence on the others. In the presented experiments, calculations on some benchmark functions classically used to test optimization methods are performed, and the results are compared to different versions of the standard PSO, that is using different topological structures of the population. The experimental results show that I-PR-PSO can converge quicker on the tested functions, and can find better results in the solution domain than its tested peers.  相似文献   

14.
针对量子行为粒子群优化算法中粒子搜索的盲目性以及初始聚类中心的选取对聚类结果的影响问题,提出了一种基于GA优化的QPSO聚类算法.该算法首先利用GA稳健的全局优化性能进行快速的粗略聚类,然后用GA的聚类结果初始化QPSO算法,以降低粒子群搜索的盲目性,从而提高QPSO算法的搜索效率.通过在Reuter-21578真实的文本数据集上实验,该算法在Fmeasure评价标准上获得了较高的查准率和查全率,从而验证了该聚类算法的有效性和可行性,可以在文本聚类领域推广应用.  相似文献   

15.
针对传统模糊C-均值聚类算法(FCM算法)初始聚类中心选择的随机性和距离向量公式应用的局限性,提出一种基于密度和马氏距离优化的模糊C-均值聚类算法(Fuzzy C-Means Based on Mahalanobis and Density,FCMBMD算法)。该算法通过计算样本点的密度来确定初始聚类中心,避免了初始聚类中心随机选取而产生的聚类结果的不稳定;采用马氏距离计算样本集的相似度,以满足不同度量单位数据的要求。实验结果表明,FCMBMD算法在聚类中心、收敛速度、迭代次数以及准确率等方面具有良好的效果。  相似文献   

16.
针对模糊C均值算法未考虑图像邻域信息,导致其分割效果不好的不足,结合隐马尔可夫随机场和高斯核函数,提出核空间隐马尔可夫随机场模糊C均值聚类算法。引入隐马尔可夫随机场,在目标函数中引入像素的空间邻域信息,使得分割算法对噪声鲁棒性增强;引入核函数,将样本点非线性变换映射到高维特征空间,增强图像分割的抗干扰能力,保持图像的细节信息。对标准灰度图像添加噪声,用以验证算法的性能。视觉效果及分割图像的峰值信噪比均显示,改进算法具有更好的抗噪能力。  相似文献   

17.
针对模糊C均值聚类算法受初始聚类中心影响过大以及易于陷入局部极值的问题,采用具有Levy flight模式且具有很强全局搜索能力的布谷鸟搜索算法,对模糊C均值聚类算法初始聚类中心进行优化,并把优化后的模糊C均值聚类算法应用于网络入侵检测。实验结果显示,经过优化后的模糊C均值聚类算法具有较好的运行速度和聚类效果,对入侵行为的检测效果良好。  相似文献   

18.
In order to overcome the premature convergence in particle swarm optimization (PSO), we introduce dynamical crossover, a crossover operator with variable lengths and positions, to PSO, which is briefly denoted as CPSO. To get rid of the drawbacks of only finding the convex clusters and being sensitive to the initial points in $k$ -means algorithm, a hybrid clustering algorithm based on CPSO is proposed. The difference between the work and the existing ones lies in that CPSO is firstly introduced into $k$ -means. Experimental results performing on several data sets illustrate that the proposed clustering algorithm can get completely rid of the shortcomings of $k$ -means algorithms, and acquire correct clustering results. The application in image segmentation illustrates that the proposed algorithm gains good performance.  相似文献   

19.
基于MPI的并行PSO混合K均值聚类算法   总被引:2,自引:0,他引:2  
传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。  相似文献   

20.
Yang  Hai  Zhu  Daming 《Multimedia Tools and Applications》2020,79(13-14):9237-9253
Multimedia Tools and Applications - Aiming at the problems of parameter optimization and insufficient utilization of split reads in the detection for copy number variation (CNV), a new definition...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号