首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
信息抽取是从大量的数据中准确、快速地获取目标信息,提高信息的利用率。考虑网页数据的特点,提出一种适用于网页信息抽取改进的隐马尔科夫模型(HMM),即结合最大熵模型(ME)在特征知识表示方面的优势,在HMM模型中加入后向依赖,利用发射单元特征来调整模型参数。改进后的HMM状态转移概率和观察输出概率不仅依赖于模型的当前状态值,而且可以以模型的前向状态值和后向特征值加以修正。实验结果表明,使用改进后的HMM模型应用到网页信息抽取中,可以有效地提高网页信息抽取的质量。  相似文献   

2.
隐马尔可夫模型(HMM)作为一种有效的概率工具,已成为信息抽取领域中一个新的研究方向.本文针对其在Web信息抽取中存在的网页结构特征利用不足的问题,给出了一种改进的模型.它通过扩展HMM中输出符号的定义,由一维扩展到多维,实现对网页结构特性的有效利用.试验表明,改进后的模型是稳定有效的,准确率平均提高了约10%.  相似文献   

3.
基于SVM-HMM混合模型的说话人确认   总被引:8,自引:0,他引:8  
提出一个文本无关的说话人确认的算法。该算法将支持向量机(SVM)的输出通过Sigmoid函数和高斯模型转化为概率,并作为隐式马尔可夫模型(HMM)中各个隐状态的输出概率。由于HMM适于处理连续信号,SVM适于处理分类问题;同时,HMM更多地表达了类别内部的相似性,而SVM则很大程度上反映了类别间的差异,因而根据两者不同的侧重点,使其组合获得了很好的效果。  相似文献   

4.
为弥补单一模型在识别低空飞行目标时的不足,进一步提高识别概率,提出了一种基于HMM(HiddenMarkov model)和SVMs(Support vector machines)串联结构的低空飞行目标声识别方法.针对战场环境下声信号的特点,该方法综合考虑HMM适合处理连续动态信号及SVM小样本情况下的强分类能力,先由HMM计算各HMM模型与待辨识信号的匹配程度,形成匹配度特征向量,再利用SVM适合分类的优势,对匹配度特征向量做进一步决策,得到最后的识别结果,弥补了单一模型在识别低空飞行目标时的不足.实际数据的识别分析结果表明了该方法在低空飞行目标声识别中的准确性与有效性.  相似文献   

5.
提出一种基于改进的HMM-SVM混合模型手写汉字签名认证方法.利用HMM对两类训练签名数据进行有区分性的特征变换及数据压缩.HMM的多雏概率输出作为SVM模型的输入矢量.SVM的输出通过Sigmoid函数转化为后验概率以进一步提高认证效果.使用SVC2004数据库中的签名数据对该方法进行验证和分析,结果表明,相对于HMM模型和SVM方法以及HMM-SUM混合模型,该方法可以有效降低等错误率EER,获得了比较好的效果.  相似文献   

6.
为进一步提高Web信息抽取的准确率,针对隐马尔可夫模型HMM(Hidden Markov Model)及混合法在参数寻优上的不足,提出一种改进遗传退火HMM的Web抽取算法。构建一个后向依赖假设的HMM;用改进遗传退火优化HMM参数,将遗传算子和模拟退火SA(simulated annealing)参数改进后,据GA(genetic algorithm)的自适应交叉、变异概率给子群体分类,实现多种群并行搜索和信息交换,以避免早熟,加速收敛;并将SA作为GA算子,加强局部寻优能力;最后,用双序Viterbi解码,与现有HMM优化法相比,实验的综合Fβ=1平均提高了6%,表明改进算法能有效提高抽取准确率和寻优性能。  相似文献   

7.
一种基于字符HMM模型级联的手写体西文单词识别方法   总被引:3,自引:0,他引:3  
提出了一种识别西文单词的级联HMM方法,在字符HMM模型基础上按照统计语法将各模型依概率连接,它扩展了HMM的模式描述方式,允许在级联模型上表征状态的跳跃、转移和驻留等,通过共享字符模型来描述级联状态转移概率,可以更加可靠地刻画手写体单的行为特点,采用面向在的Viterbi算法,在完整的单词采样序列输入后直接识别,无需做字符的分割和标注,从而避免了在字典中为每个单词建立模型而导致的识别不同步问题,用WE-1单词样本库进行试验,级联模型法的第1侯选识别经为89.26%,带有连字模型的HMM法的第1候选识别率为82.34%,降低错误识别率达39.18%。  相似文献   

8.
基于改进的隐马尔科夫模型的汉语词性标注   总被引:1,自引:0,他引:1  
王敏  郑家恒 《计算机应用》2006,26(Z2):197-198
基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系.还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型.实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果.  相似文献   

9.
网络信息抽取是从半结构化的Web海量数据中,按用户要求抽取且形成相关的有效的结构数据处理过程。论文以隐马尔科夫模型(HMM)进行数据抽取中的若干关键问题进行研究,提出了基于数据挖掘聚类的模型合并方法生成隐马尔可夫模型,即可根据数据自动生成HMM,同时对一般的隐马尔可夫模型进行了扩展,为每个抽取域生成一个隐马尔可夫模型,用于获取更多的有用信息。  相似文献   

10.
基于特征相似度的论文元数据抽取算法与传统的DOM树方法相比,提高了论文元数据的抽取成功率.但论文元数据的抽取效率却不高,而论文元数据的抽取与蜘蛛的论文爬取是同时进行的,对元数据的抽取有实时性要求,因此影响了论文数据量的增加.经过比较研究,利用决策树中的C4.5算法对特征相似度算法进行改进,论文元数据的抽取成功率提高了2%,抽取效率提高了62%.  相似文献   

11.
针对作者已经提出的双因子高斯过程隐变量模型(Two-factor Gaussian process latent variable model,TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model,HMM)对语音动态特征进行建模,并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡.  相似文献   

12.
基于多模板隐马尔可夫模型的文本信息抽取算法   总被引:1,自引:0,他引:1  
由于训练数据来源的多样化,难以通过学习得到最优的模型参数,因此提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法。该算法首先利用文本排版格式和分隔符等信息,对文本进行分块;然后在分块的基础上,对训练数据进行聚类以形成多个形式的模板(多模板),并对多模板数据训练得到隐马尔可夫初始概率及转移概率参数;最后,用被训练的数据统一训练释放概率参数,结合初始概率、转移概率以及释放概率参数对文本信息进行抽取。实验结果表明,该算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能。  相似文献   

13.
一种基于DSmT和HMM的序列飞机目标识别算法   总被引:1,自引:1,他引:0  
针对姿态多变化的飞机自动目标识别中的低识别率问题, 提出了一种基于DSmT (Dezert-Smarandache theory)与隐马尔可夫模型(Hidden Markov model, HMM)的飞机多特征序列信息融合识别算法(Multiple features and sequential information fusion, MFSIF). 其创新性在于将单幅图像的多特征信息融合识别和序列图像信息融合识别进行有机结合.首先, 对图像进行二值化预处理, 并提取目标的Hu矩和轮廓局部奇异值特征; 然后, 利用概率神经网络(Probabilistic neural networks, PNN)构造基本信度赋值(Basic belief assignment, BBA); 接着, 利用DSmT对该图像的不同特征进行融合,从而获得HMM的观察值序列;再接着, 利用隐马尔可夫模型对飞机序列信息融合, 计算观察值序列与各隐马尔可夫模型之间的相似度, 从而实现姿态多变化的飞机目标自动识别;最后, 通过仿真实验, 验证了该算法在飞机姿态发生较大变化时, 依然可以获得较高的正确识别率,同时在实时性方面也可以满足飞机目标识别的要求. 另外, 在飞机序列发生连续遮挡帧数τ ≤ 6的情况下, 也具有较高的飞机目标正确识别率.  相似文献   

14.
SVM和HMM混合模型在人脸识别中的应用   总被引:1,自引:1,他引:1       下载免费PDF全文
采用支持向量机(SVM)和隐马尔可夫模型(HMM)相结合的方法进行人脸识别。首先对照片中的人脸进行定位,从定位区域提取人脸各个器官的独立基特征,然后使用支持向量机和隐马尔可夫混合模型对定位区域进行人脸识别。利用SVM和HMM结合的优点,取得较高的识别率。  相似文献   

15.
研究语音识别率问题,语音信号是一种非平稳信号,含有大量噪声信息,目前大多数识别算法线性理论,难以正确识别语音信号非线性变化过程,识别正确率低。通过将隐马尔可夫模型(HMM)和SVM相结合组成一个混合抗噪语音识别模型(HMM-SVM)。同时用HMM模型对语音信号时序进行建模,并得到待识别语音信号的输出概率,然后将输出概率作为SVM的输入进行学习,得到语音分类信息,最后通过利用HMM-SVM识别结果做出正确识别决策。仿真结果表明,HMM-SVM提高语音识别正确率,尤其在低信噪比环境下,明显改善了语音识别系统的性能。  相似文献   

16.
张志平  汪庆淼 《计算机工程》2010,36(23):139-141,145
根据隐马尔可夫模型(HMM)适用于处理连续动态序列信号、支持向量机(SVM)与K近邻分类器(KNN)擅长模式分类的特点,设计一种(HMM+KNN)+SVM的混合分类器。利用HMM与KNN对测试样本进行判决。当判决结果相同时,直接输出判决结果,否则引入SVM对测试样本进行再判决。实验结果表明,该方法所确定的分类器优于单一的分类器判决,能有效实现表情识别。  相似文献   

17.
人体动作产生的辐射能量变化(Infrared radiation changes,IRC)信号是动作识别的重要线索,本文提出了一种基于隐马尔科夫模型的人体动作压缩红外分类新方法.针对人体动作的自遮挡问题,建立基于正交视角的压缩红外测量系统,获取人体动作在主投影面和辅助投影面的IRC压缩信号;然后,采用隐马尔科夫模型(Hidden Markov model,HMM)双层特征建模算法进行压缩域动作分类.实验结果表明双层特征建模的平均正确分类率高于主层特征建模,平均正确分类率可达95.71%.该方法为环境辅助生活系统提供了人体动作识别的新途径.  相似文献   

18.
应用ANN/HMM混合模型预测蛋白质二级结构*   总被引:1,自引:1,他引:0       下载免费PDF全文
针对3状态隐马尔可夫模型(hidden Markov model,HMM)预测蛋白质二级结构准确率不高的问题,提出15状态HMM,通过改进的算法与BP神经网络相结合进行二级结构预测。研究对象为CB513数据集中筛选出的492条蛋白质序列,将其随机均分7组。应用混合模型进行预测,对准确率进行7交叉验证,Q3准确率达7721%,SOV值为7252%。结果表明,混合模型既能充分考虑相邻氨基酸残基间的相互影响,也能在一定程度上照顾二级结构的远程相关性,因此带来了较好的预测准确率。  相似文献   

19.
计算机系统入侵检测的隐马尔可夫模型   总被引:32,自引:0,他引:32  
入侵检测技术作为计算机安全技术的一个重要组成部分,现在受到越来越广泛的关注,首先建立了一个计算机系统运行状况的隐马尔可夫模型(HMM),然后在此模型的基础上提出了一个用于计算机系统实时异常检测的算法,以及该模型的训练算法。这个算法的优点是准确率高,算法简单,占用的存储空间很小,适合用于在计算机系统上进行实时检测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号