首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于多模板隐马尔可夫模型的文本信息抽取算法   总被引:4,自引:0,他引:4       下载免费PDF全文
针对训练数据来源的多样化,提出了基于多模板隐马尔可夫模型的广本信息抽取算法。该算法利用形式的聚类方法将训练数据聚成几个类,每个类代表一个模板,在聚类的基础上利用隐马尔可丈模型进行文本的信息抽取。实验结果表明,新算法具有较高的精确度和召回率。  相似文献   

2.
一种基于二维隐马尔可夫模型的图像分类算法   总被引:2,自引:0,他引:2  
针对图像分块之间的相互依赖关系,提出一种基于二维隐马尔可夫模型的图像分类算 法。该算法将一维隐马尔可夫模型扩展成二维隐马尔可夫模型,模型中相邻的图像分块在平面两个 方向上按条件转移概率进行状态转换,反应出两个维上的依赖关系。隐马尔可夫模型参数通过期望 最大化算法(EM)来估计。同时,本文利用二维Viterbi算法,在训练隐马尔可夫模型的基础上,实现 对图像进行最优分类。文件图像分割的应用表明,隐马尔可夫算法优于CART算法。  相似文献   

3.
基于隐马尔可夫模型的中文科研论文信息抽取   总被引:1,自引:1,他引:0       下载免费PDF全文
随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要。该文提出了一种基于隐马尔可夫模型的中文科研论文头部信息和引文信息抽取算法,分析了模型结构的学习和参数估计方法。在进行信息抽取时,利用分隔符、特定标识符等格式信息对文本进行分块,利用隐马尔可夫模型进行指定域的抽取。实验结果表明,该算法具有良好的准确率和召回率。  相似文献   

4.
随着因特网技术的迅速发展,网上信息成几何级数增长,如何从这些海量联机非结构化文本中自动抽取出结构化信息成为目前重要的研究课题。研究了基于隐马尔可夫模型的Web信息抽取算法,着重探讨了隐马尔可夫模型在文本信息抽取中应该如何应用,数据应该如何标记,并对隐马尔可夫模型在文本信息抽取中的应用提出了几个改进的方法,建立了基于HMM的Web信息抽取模型,并对信息抽取后的数据进行了分析对比,验证了改进算法的有效性。  相似文献   

5.
基于改进HMM的文本信息抽取模型   总被引:1,自引:0,他引:1       下载免费PDF全文
梁吉光  田俊华  姜杰 《计算机工程》2011,37(20):178-179
提出一种基于改进隐马尔可夫模型(HMM)的文本信息抽取模型。给出一个新假设,使用绝对平滑算法对模型参数进行平滑,利用Viterbi算法对观察值序列进行正序和逆序解码,基于N-Gram模型对2次解码结果进行对比消歧,得到较准确的状态序列。实验结果表 明,该信息抽取模型能提高信息抽取的准确率。  相似文献   

6.
传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数。提出了一种使用遗传算法优化HMM模型参数的Web信息抽取混合算法。该算法使用实数矩阵编码表示染色体,似然概率值为适应度取值,将GA与Baum-Welch算法相结合对HMM模型参数进行全局优化,并且调整GA-HMM的Baum-Welch算法参数实现Web信息抽取。实验结果表明,新的算法在精确度和召回率指标上比传统HMM具有更好的性能。  相似文献   

7.
针对网络用户兴趣行为特征的抽取,提出了一种基于隐半马尔可夫模型的用户兴趣特征提取模型,通过用状态驻留时间的概率来控制用户浏览行为,使描述兴趣特征的隐状态和时间的相关性更紧密地结合起来,并且根据隐半马尔可夫模型可以产生多观察值序列的特性,把文本信息划分成多个文本块子区域,使每个子区域的特征和其中一个观察值序列对应起来。实验结果表明,利用隐半马尔可夫模型进行特征提取比HMM方法有更高的准确率和召回率。  相似文献   

8.
针对经典马尔可夫模型没有考虑模型应用中状态、观测量间的上下文相关性以及状态转移概率动态性、可变性,提出一种模糊深隐马尔可夫模型.该模型通过增加观测值间的相关性、解决概率转移问题中的不确定性和改进参数优化算法,使之能够较好地应用于强噪声、训练数据缺损等情形的模式识别中.理论证明,显式模糊深隐马尔可夫模型在同等模型复杂度下具有模型优化程度高、区分度好、误识率低、鲁棒性高的特性.  相似文献   

9.
本文结合小波域隐马尔可夫树模型(Hidden Markov Tree,HMT)和支持向量回归(Support Vector Regression,SVR)分析法提出了估计信息嵌入率的定量隐写分析。本文分别将垂直、水平和对角的小波系数建模为两状态的HMT模型,用EM算法(Estimation and Maximization Algorithm)对HMT模型进行训练得出包括状态初始概率、小波子带的转移概率和方差在内的模型参数,由这些参数构成图像的特征。然后结合SVR建立定量隐写分析器,并估计F5,outguess和MB三种隐写图的信息嵌入率。  相似文献   

10.
文本分割是自然语言文本处理的一项重要研究内容。该文针对现有模型无法有效分割概括性小文本的不足,提出基于隐马尔可夫模型的统计算法。该算法利用小文本中各结构块的长度及词汇信息,对概括性小文本进行同一主题不同论述侧面的分割。对发射概率设计了基于句群和基于分割点2种不同的计算方法。以Medline摘要为样本进行的实验表明,该算法对概括性小文本分割是有效的,明显好于经典的TextTiling算法。  相似文献   

11.
针对用于隐马尔科夫模型(HMM)训练的经典Baum Welch算法容易陷入局部最优解这一问题,提出基因克隆的Baum Welch算法。该算法在Baum Welch算法迭代计算到10-3以内不再改变的情况下,在当前已获得局部最优参数B矩阵的基础上,执行基因克隆算子,获得优化的HMM的B参数,进一步提升Baum Welch算法语音模板的输出概率。实验结果表明:该算法模板计算概率大于经典的Baum Welch算法,获得了比Baum Welch算法更优的训练模板。  相似文献   

12.
提出了基于高斯混合输出的连续隐马尔可夫模型的步态识别方法。首先,利用k-均值聚类法对步态序列建立初始的高斯混合模型,然后采用Baum-Welch算法对初始连续隐马尔可夫模型参数不断训练求精,在训练过程中对所存在的问题做适当的改进,解决了算法的溢出问题,最后用最前向算法进行识别;利用CASIA数据库对该算法进行验证,取得了较高的识别率,并对视角变化有一定的鲁棒性。  相似文献   

13.
摘要:针对XML数据的质量问题,以XML键为基础,借助多模板隐马尔可夫模型信息抽取策略与粒子群优化算法构建新的XML数据清洗方法。为了提高XML相似性数据并行检测效率,利用波函数对粒子群优化算法进行优化。仿真实验表明,与其他XML数据清洗算法相比,该方法的白适应学习能力强、人工参与程度低、计算量小,时间性能有94%左右的提升。  相似文献   

14.
本文提出了基于RBF-HMM模型的网络入侵检测方法,给出了该模掣的训练和识别方法.因为HMM模型的分类决策能力和对不确定信息的描述能力不理想,而人工神经网络对动志时间序列的建模能力尚不尽如人意,所以将RBF神经网络集成到HMM框架中,用RBF神经网络为HMM提供状态概牢输出.通过RBF神经网络的粗分类,克服了HMM的缺...  相似文献   

15.
细胞膜离子单通道电流十分微弱(PA级),用膜片钳技术测量离子电流往往淹没在强噪声背景中。目前,采用阈值检测方法恢复通道电流信号。但是,通道开放和关闭的电流阈值需要人为设定,并且阈值法在较低信噪比时失效。采用隐马尔可夫模型(HMM)重构离子单通道电流并估计模型参数。对离子通道HMM进行描述和分析;运用Baum-Welch迭代算法训练HMM并估计模型参数;利用Viterbi算法重构通道电流最佳状态序列。将HMM与阈值法进行比较,对不同信噪比和不同转移概率情况下HMM恢复算法进行计算机仿真。结果表明:HMM与阈值法相比,具有较强抗噪能力。在较低信噪比情况下,该模型恢复信号精度高,参数收敛速度快,且电流重构误差主要出现在状态突变点。  相似文献   

16.
针对静态手势识别问题,提出了一种综合考虑局部形状与全局轮廓的隐马尔科夫模型(HMM)静态手势识别算法。该算法提取局部形状熵特征与上层轮廓特征分别作为训练数据训练每类手势的HMM参数。测试时,先凭借局部形状熵特征得出初步识别结果,然后根据初步识别结果的模糊性,附加与局部特征互补的上层轮廓特征进行再识别,得出最终识别结果。实验结果表明,该算法对于形状差异占主导地位的手势库有很好的效果,并且将静态手势的空间序列模拟成时间序列使得静态手势识别具有空间尺度不变性;同时该算法合理控制特征维数,一定程度上弱化了HMM训练时间长的弊端,加快了识别的速度。  相似文献   

17.
In this paper, a novel method of real-time fire detection based on HMMs is presented. First, we present an analysis of fire characteristics that provides evidence supporting the use of HMMs to detect fire; second, we propose an algorithm for detecting candidate fire pixels that entails the detection of moving pixels, fire-color inspection, and pixels clustering. The main contribution of this paper is the establishment and application of a hidden Markov fire model by combining the state transition between fire and non-fire with fire motion information to reduce data redundancy. The final decision is based on this model which includes training and application; the training provides parameters for the HMM application. The experimental results show that the method provides both a high detection rate and a low false alarm rate. Furthermore, real-time detection has been effectively realized via the learned parameters of the HMM, since the most time-consuming components such as HMM training are performed off-line.  相似文献   

18.
朱义鑫  闵东 《计算机工程与应用》2006,42(24):145-148,151
文章从HMM的基本思想、概念出发,建立了以捕获的网络数据包为观测对象的HMM异常检测原型。对原型中存在的可见符号集太大的问题,提出了对观测对象进行分段的改进办法,进而建立了具有可操作性的HMM异常检测模型。在观测对象的概率计算方面,引入了滑动窗口的概念,解决了概率值过小的问题。对模型的训练,给出了模型训练算法、矩阵B的更新公式。  相似文献   

19.
对于具有大量特征数据和复杂发音变化的英语语音,与单词相比,在隐马尔可夫模型(HMM)中存在更多问题,例如维特比算法的复杂度计算和高斯混合模型中的概率分布问题。为了实现基于HMM和聚类的独立于说话人的英语语音识别系统,提出了用于降低语音特征参数维数的分段均值算法、聚类交叉分组算法和HMM分组算法的组合形式。实验结果表明,与单个HMM模型相比,该算法不仅提高了英语语音的识别率近3%,而且提高系统的识别速度20.1%。  相似文献   

20.
依存分析和HMM相结合的信息抽取方法   总被引:1,自引:0,他引:1  
信息抽取是文本信息处理的一个重要环节,当前的信息抽取研究工作大多针对半结构化的文本。针对自由文本,提出一种依存分析和HMM相结合的文本信息抽取算法,该算法在运用依存分析对句子进行浅层句法分析的基础上制定相应规则,形成输入序列,结合HMM易于建立、适应性好、抽取精度较高的优势,实现自由文本的信息抽取。实验结果表明,新的算法在召回率、准确率和正确率指标上均有良好的性能,说明了算法的有效性,为文本信息的抽取提供了新思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号