首页 | 本学科首页   官方微博 | 高级检索  
     

混合遗传算法和隐马尔可夫模型的Web信息抽取
引用本文:肖基毅,邹腊梅,李传琦.混合遗传算法和隐马尔可夫模型的Web信息抽取[J].计算机工程与应用,2008,44(18):132-135.
作者姓名:肖基毅  邹腊梅  李传琦
作者单位:南华大学 计算机科学与技术学院,湖南 衡阳 421001
基金项目:湖南省自然科学基金 , 湖南省教育厅科研项目
摘    要:传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数。提出了一种使用遗传算法优化HMM模型参数的Web信息抽取混合算法。该算法使用实数矩阵编码表示染色体,似然概率值为适应度取值,将GA与Baum-Welch算法相结合对HMM模型参数进行全局优化,并且调整GA-HMM的Baum-Welch算法参数实现Web信息抽取。实验结果表明,新的算法在精确度和召回率指标上比传统HMM具有更好的性能。

关 键 词:遗传算法  隐马尔可夫模型  Web信息抽取  Baum-Welch算法  最大似然算法
文章编号:1002-8331(2008)18-0132-04
收稿时间:2007-9-25
修稿时间:2007年9月25日

Hybrid genetic algorithm and hidden Markov model for Web information extraction
XIAO Ji-yi,ZOU La-mei,LI Chuan-qi.Hybrid genetic algorithm and hidden Markov model for Web information extraction[J].Computer Engineering and Applications,2008,44(18):132-135.
Authors:XIAO Ji-yi  ZOU La-mei  LI Chuan-qi
Affiliation:School of Computer Science and Technology,University of South China,Hengyang,Hunan 421001,China
Abstract:The traditional training method of HMM for Web information extraction is sensitive to the initial model parameters and easy to lead to a sub-optimal model in practice.A hybrid algorithm is proposed to optimize HMM parameters by using genetic algorithm for Web information extraction.The algorithm makes use real number matrix encoding as the representation of the chromosomes,the fitness values are the results of the likelihood values,combines GA and Baum-Welch algorithm to optimize HMM parameters globally,and then to adjust the Baum-Welch algorithm parameters in GA-HMM for Web information extraction.Experimental results show that the new algorithm improves the performance in precision and recall.
Keywords:genetic algorithm  hidden Markov model  Web information extraction  Baum-Welch algorithm  maximum likelihood algorithm
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号