首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于EM的启动子序列半监督学习   总被引:1,自引:0,他引:1  
启动子的预测对于基因的定位有重要意义.已有多种对启动子进行预测的算法,涉及到信号搜索、内容搜索和CpG岛搜索等多种策略.基于马尔可夫模型的启动子分类方法也有研究,其中的转移概率都是直接通过统计已标号训练样本序列得来的.将半监督学习思想引入启动子序列分析中,推导出转移概率等参数的最大似然估计公式.实验中将待测试基因序列片段同已标号训练样本混合,利用得出的参数值对基因序列片段进行识别,使用少量的已标号的样本数据能得出较好的启动子识别结果.  相似文献   

2.
随着后基因组时代的到来,如何去揭示序列背后隐藏的生命信息已成为当前生命科学探讨的主题。而控制基因表达的正是启动子序列,如何去识别和预测序列的启动子区域是基因研究的重点课题。隐马尔可夫模型是最近几年研究基因最主要的模型。本文首先探讨了EM算法并提出了随机迭代算法,在初始状态分布和散发矩阵都随机假设,而转移矩阵由序列计算出的奈件下时人类启动子序列进行识别,平均识别率达到了92.05%。改进了多分类问题中的“投票策略”,提出了“一票决定”算法,使算法次数由O(N2)降到了O(N),由此对多个DNA家族进行分类,正确率达90.73%。从结果上看,在两类问题上,支持向量机比隐马尔可夫模型优越,但在处理多分类问题上隐马尔可夫模型却比支持向量机有更强的分类能力。  相似文献   

3.
提出了一种基于混合高斯隐马尔可夫模型的带式输送机堆煤时刻预测方法。该方法根据传感器采集的带式输送机功率时序数据建立带式输送机运行状态的混合高斯隐马尔可夫模型,基于该模型采用基于图的状态序列遍历算法和基于切普曼-柯尔莫哥罗夫方程的概率转移算法对带式输送机堆煤时刻进行预测:基于图的状态序列遍历算法通过寻找当前状态到堆煤状态的通路确定剩余时间;基于切普曼-柯尔莫哥罗夫方程的概率转移算法通过粒子群优化算法及切普曼-柯尔莫哥罗夫方程交叉验证来获取训练样本上失败状态的概率阈值,并计算当前的状态迁移到超过失败状态概率阈值的转移次数来确定剩余时间。基于煤矿生产实际数据集的实验验证了该方法可有效预测带式输送机的堆煤发生时刻。  相似文献   

4.
首先提出一种改进的算法NONEPI++,用于挖掘事件序列上非重叠发生的频繁情节;然后将每个频繁情节表示为相应的情节隐马尔可夫模型EHMM,并通过最大期望算法计算模型的混合系数,从而生成一个基于历史数据流的混合模型;最后,基于该混合模型预测目标事件类型出现的概率。实验表明,混合EHMM模型能有效地预测数据流。  相似文献   

5.
基于线性预测与马尔可夫模型的入侵检测技术研究   总被引:13,自引:0,他引:13  
入侵检测技术是现代计算机系统安全技术中的重要组成部分.该文提出了基于线性预测与马尔可夫模型相结合的入侵检测方法.首先提取特权进程的行为特征,引入时间序列分析技术——用线性预测技术对特权进程产生的系统调用序列提取特征向量来建立正常特征库,并在此基础上建立了马尔可夫模型.由马尔可夫模型产生的状态序列计算状态概率,根据状态序列概率来评价进程行为的异常情况.然后,利用马尔可夫信源熵与条件熵进行参数选取,对模型进行优化,进一步提高了检测率.实验表明该算法准确率高、实时性强、占用系统资源少.  相似文献   

6.
根据基于时间序列的船舶航行定位数据的特征,在差分自回归移动平均模型的基础上,运用马尔可夫链状态转移概率特性解决非平稳数据的预测问题,在建立马尔可夫链状态迁移概率矩阵过程中,使用K-means聚类算法划分预测值与真实值的差值状态区间,继而构建出优化预测算法。对算法进行了理论分析和数值实验,并与其他算法进行了比较,结果表明,该优化算法在船舶定位数据短时预测领域具有较好的预测效果,优于多个其他算法,可应用于船舶移动定位产品中。  相似文献   

7.
在移动对象轨迹预测中,针对低阶马尔可夫模型预测准确率不高、高阶模型状态空间膨胀的问题,提出一种基于概率后缀树(PST)的动态自适应变长马尔可夫模型预测方法。首先依时间先后将移动对象的轨迹路径序列化;然后根据移动对象的历史轨迹数据进行学习训练,计算序列上下文的概率特征,建立路径序列的概率后缀树模型,结合当前实际轨迹数据,动态自适应预测将来的位置信息。实验结果表明,该模型在二阶时取得最高的预测精度,随着阶数的增加,预测精度保持在82%左右,能取得较好的预测效果;同时空间复杂度呈指数级减少,大大节省了存储空间。该方法充分利用历史轨迹数据和当前轨迹信息预测未来轨迹,能够提供更加灵活、高效的基于位置服务。  相似文献   

8.
提出一种基于改进Hu矩和隐马尔可夫模型相结合的ATM机异常行为识别方法。对ATM机前用户存(取)款行为的视频序列用改进Hu变换提取运动目标的行为特征,采用Baum-Welch算法对用户的正常行为进行训练,并建立隐马尔可夫模型;最后通过模型输出测试样本序列的概率来识别异常行为。采用Matlab对ATM机用户运动行为的模拟视频进行实验仿真,结果表明:该方法对ATM机前的用户行为具有较高的识别率。  相似文献   

9.
为弥补传统的基于隐M arkov模型在前提假设上的不足,提出了二阶隐马尔可夫模型。在研究二阶隐马尔可夫模型和凝聚算法在时空序列分析的基础上,提出了一种新的基于 HMM2的时间序列凝聚算法。该算法应用 HMM2对时间序列进行建模,合理考虑了概率和模型历史状态的关联性,按照相异度原则将序列聚成几个类,每个类用模型代表,进而对这些模型训练、合并及迭代得到聚类结果。实验比较了该算法与基于HMM算法的聚类质量,研究了聚类正确率与聚类数、距离正确率与模型距离的关系。结果表明,该算法比传统的基于HMM的聚类算法具有更好的性能。  相似文献   

10.
针对隐马尔可夫模型在进行设备健康诊断时与实际存在较大偏差的问题,提出了一种以似幂关系加速退化为核心的改进退化隐马尔可夫模型(DGHMM).首先,引入退化因子描述设备衰退过程,提出的似幂关系加速退化较常规指数式加速退化而言,能更好地描述设备服役期间随着役龄增加性能的逐步下降.其次,以全局搜索能力相对较强的改进遗传算法代替常规EM算法进行参数估计,克服了EM算法易陷入局部最优的局限性.同时,针对隐马尔可夫模型时间上须服从指数分布而不能直接用于寿命预测的局限性问题,提出了一种以近似算法与Viterbi算法为基础的贪婪近似法,以寻求最大概率剩余观测为目的,动态地寻求最大概率剩余状态路径,对设备剩余寿命进行预测.最后,通过美国卡特彼勒公司液压泵数据集对所提出的方法进行验证评价.结果表明,基于改进退化隐马尔可夫模型的设备健康诊断与寿命预测方法在描绘设备退化、设备状态诊断准确率方面更加有效,在剩余寿命预测上亦为可行.  相似文献   

11.
针对低阶Markov模型预测精度较差,以及多阶Markov模型预测稀疏率高的问题,提出一种基于Markov模型与轨迹相似度(MMTS)的移动对象位置预测算法。该方法借鉴了Markov模型思想对移动对象的历史轨迹进行建模,并将轨迹相似度作为位置预测的重要因素,以Markov预测模型的预测结果集作为预测候选集,结合相似度因素得出最终预测结果。实验结果表明,与k阶Markov模型相比,该方法的预测性能不会随着训练样本大小及阶数k的变化受到很大的影响,并且在大幅降低k阶Markov模型预测稀疏率的同时将预测精度平均提高了8%以上。所提方法不仅解决了k阶Markov模型的预测稀疏率高及预测精度不足的问题;同时提高了预测的稳定性。  相似文献   

12.
针对用于隐马尔科夫模型(HMM)训练的经典Baum Welch算法容易陷入局部最优解这一问题,提出基因克隆的Baum Welch算法。该算法在Baum Welch算法迭代计算到10-3以内不再改变的情况下,在当前已获得局部最优参数B矩阵的基础上,执行基因克隆算子,获得优化的HMM的B参数,进一步提升Baum Welch算法语音模板的输出概率。实验结果表明:该算法模板计算概率大于经典的Baum Welch算法,获得了比Baum Welch算法更优的训练模板。  相似文献   

13.
目的 调色板编码是屏幕内容编码的典型方法之一,其索引图的编码效率直接影响到调色板编码算法的总体压缩性能。但是,在处理物体前景和文字边缘的过渡区或连接区索引时,现有索引图预测编码方法的效率仍有待改善。为此提出一种基于马尔可夫模型的索引图预测算法。方法 随机选取了2 000个局部预测失败的索引值并将它们划分为3类典型分布,发现前2类分布的索引值往往处于边缘的灰度平滑过渡区,相邻索引值间呈现较为明显的线性变化,进而提出采用1阶2维马尔可夫随机过程来刻画这种线性性。对于一个待预测索引值,首先利用1阶2维马尔可夫模型计算相邻索引值的线性相关得到初始预测值,再利用颜色转移概率最大化确定其最优预测值。结果 本文算法的预测准确率为97.53%,比多级预测算法(MSP)和基于局部方向相关性的预测算法分别平均提高了4.33%和2.10%,尤其适用于包含大量文字字符和几何图元的视频序列的索引图预测。并且,渐近时间复杂度与基于局部方向相关性的预测算法相当,明显低于MSP。具体地,本文算法的实际运行时间比MSP算法节省了95.08%,比基于局部方向相关性的预测算法增加了35.46%。结论 本文提出的基于马尔可夫模型的索引图预测算法通过发掘索引值在边缘区域的线性相关性和特定的颜色转移模式,提高了索引预测效率,并保持了较低的计算复杂度,可应用在屏幕内容文本/图形块的调色板编码中。  相似文献   

14.
李琰  刘嘉勇 《计算机应用》2018,38(4):939-944
由于全球定位系统(GPS)设备采集的用户历史位置数据通常具有稀疏性,使得基于单个用户数据的位置预测模型能力受限,所以结合人类移动性的时间和空间周期性,提出一种基于作者主题模型(ATM)和辐射模型(RM)的用户位置预测模型。在时间维度上,该模型利用ATM发现与目标用户移动行为相似的用户群,并确定该用户群在预测时刻所处的目标状态;在空间维度上,该模型利用RM算法计算目标用户的候选地点在目标状态下的概率,并通过比较各候选地点的概率值确定目标用户可能出现的地点,从而实现对目标用户位置的预测。实验结果表明,该模型的平均预测准确率为61.49%,相对于基于变阶的Markov模型提高近28个百分点。所提预测模型能够在单个用户数据量小的条件下获得更高的预测准确率。  相似文献   

15.
董莎莎  徐一兵  李勇  高敏  刘益 《计算机工程》2010,36(17):204-205,209
为提高交互式多模型(IMM)算法对机动目标的估计精度,需要增加其模型数量,但模型过多将导致计算量大并降低估计器性能。针对上述问题提出一种基于模型集的双马尔可夫多假设IMM机动目标跟踪算法。该算法用模型集间的马尔可夫转移阵描述模型集之间的大跳变,用模型的马尔可夫转移阵描述模型集内各模型间的小跳变或慢变,以达到细化建模、提高滤波精度的目的。  相似文献   

16.
针对车辆电源系统状态趋势问题,提出了一种加权隐马尔可夫模型的状态预测方法。通过建立电源系统的隐马尔可夫模型,利用加权预测思想对隐马尔可夫模型中隐状态序列进行预测,将最大概率隐状态利用观测概率密度计算出状态观测值。通过对电压调节脉宽信号的导通率进行预测,并与BP神经网络和自回归(AR)模型对相同序列的预测结果进行对比,结果表明该方法对系统的状态变化具有较好的预测能力。  相似文献   

17.
平面图像由于缺少深度信息从而难以从中获取人体的三维尺寸信息,传统线性回归方法拟合的尺寸信息为该人体所属阈值区间的均值,由于忽视了人体自身的异构性,导致拟合的尺寸误差较大。采用模型重建的方法,可以提高尺寸获取的精度。但是,利用深度神经网络的方法由于计算量与参数规模较大,难以部署到移动终端中。因此,提出了基于改进GA-BP-MC神经网络的人体三维尺寸预测模型UGA-BP-MC,通过改进自适应交叉、变异概率优化的遗传算法(UGA)对BP网络的结构、权值和阈值进行优化,然后采用马尔科夫残差模型对UGA-BP模型输出值进行修正。最后通过工程实例对210组样本进行数据对比分析发现,相对于超椭圆曲线法、多元函数模型和GA-BP模型,UGA-BP-MC预测值的平均误差分别减少了2.8 cm, 1.62 cm和0.94 cm。  相似文献   

18.
基于多模板隐马尔可夫模型的文本信息抽取算法   总被引:1,自引:0,他引:1  
由于训练数据来源的多样化,难以通过学习得到最优的模型参数,因此提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法。该算法首先利用文本排版格式和分隔符等信息,对文本进行分块;然后在分块的基础上,对训练数据进行聚类以形成多个形式的模板(多模板),并对多模板数据训练得到隐马尔可夫初始概率及转移概率参数;最后,用被训练的数据统一训练释放概率参数,结合初始概率、转移概率以及释放概率参数对文本信息进行抽取。实验结果表明,该算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能。  相似文献   

19.
针对模糊聚类算法邻域信息与空间信息利用率低,易受噪声影响的问题,提出一种结合马尔科夫随机场模型的改进模糊C均值算法(Fuzzy C-Means,FCM),即FKMFCM算法。在FCMKM算法基础上添加马尔科夫随机场先验概率,利用先验概率改进FCM算法的目标函数,提高FCM算法抗噪性。为验证FKMFCM算法的性能,选取Bezdek划分系数、Xie_Beni系数、运行时间、迭代次数4个评测指标作为对比实验的评价标准。实验结果表明,FKMFCM算法能有效地提高模糊聚类算法的抗噪性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号