首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
基于MATLAB的隐马尔可夫模型识别CpG岛   总被引:1,自引:0,他引:1  
随着多数生物基因组测序工作的完成,基因识别就显得尤为重要.CpG岛在基因组中有着重要的生物学意义,而识别CpG岛将有助于基因的识别.因此构建了识别DNA序列中CpG岛的隐马尔可夫模型HMM(Hidden Markov Model),并利用网上人类基因CpG岛数据库中随机选取的94条基因序列数据对该模型进行训练与检测,得到了很高的预测准确率,结果表明HMM用于CpG岛的识别是快速有效的.  相似文献   

2.
基于EM的启动子序列半监督学习   总被引:1,自引:0,他引:1  
启动子的预测对于基因的定位有重要意义.已有多种对启动子进行预测的算法,涉及到信号搜索、内容搜索和CpG岛搜索等多种策略.基于马尔可夫模型的启动子分类方法也有研究,其中的转移概率都是直接通过统计已标号训练样本序列得来的.将半监督学习思想引入启动子序列分析中,推导出转移概率等参数的最大似然估计公式.实验中将待测试基因序列片段同已标号训练样本混合,利用得出的参数值对基因序列片段进行识别,使用少量的已标号的样本数据能得出较好的启动子识别结果.  相似文献   

3.
置信度加权在线序列标注算法   总被引:2,自引:2,他引:0  
序列标注问题是自然语言处理领域的基本问题之一. 序列标注任务是将连续输入的不定长序列, 标注成连续等长的标签序列. 在在线序列标注方法的基本框架下, 针对序列标注任务的特征稀疏特性, 采用置信度加权分类算法思想, 提出了一种新的线性判别式在线序列标注方法---置信度加权在线序列标注算法. 该方法对每个特征权值参数引入一个概率置信度, 取得了优于其他相关算法的性能. 在中文分词, 中文名实体识别以及英文组块分析等问题上, 验证了本文方法的有效性.  相似文献   

4.
在电商网站评论文本中,评价对象和评价属性的缺省识别对文本情感分析具有重要地作用。针对电商网站评论文本中评价对象和评价属性缺省问题,该文提出了一种基于条件随机场的评价对象缺省项识别方法。首先利用情感词典识别观点句,将缺省项识别问题转换成序列标注问题,综合词法特征和依存句法特征,使用条件随机场模型进行训练,并在测试集上对待识别的观点句进行序列标注,通过标注结果判定缺省项的位置。实验结果表明,该方法具有较高的准确率和召回率,验证了该方法的有效性。  相似文献   

5.
基于双层模型的维吾尔语突发事件因果关系抽取   总被引:1,自引:0,他引:1  
针对传统事件因果关系识别覆盖范围小和人工标注代价高等不足,提出了一种基于双层模型的维吾尔语突发事件因果关系抽取方法. 该方法采用分治思想,将因果关系抽取问题转化为对事件序列的两次模式识别标注. 采用Bootstrapping算法,在第一次模式识别时,标注因果关系的语义角色,并将标注的语义角色标签作为新的特征传递给第二层模式识别,用于因果关系边界标注. 该方法用于维吾尔语突发事件显式因果关系的抽取准确率为85.39%,召回率为77.53%,证明了本文提出的方法在维吾尔语主题突发事件因果关系抽取上的有效性和实用性.  相似文献   

6.
人类基因组计划的开展随之产生了巨量的基因组信息,区分DNA序列上的外显子和内含子成为基因工程中对基因进行识别和鉴定关键环节之一[1].如何建立良好的系统模型将基因组数据进行有效地存储、分析和挖掘,仍是难题.本文着重研究将多层前馈神经网络应用于基因序列的预测分析中,成功从基因序列上识别出剪接位点,进而区分内舍子和外显子边界.使用MATLAB神经网络工具箱和图形用户界面开发技术,对UCI机器学习数据库中的基因数据集采用二进制数字编码,完成样本选取;创建优化算法的BP神经网络和GRNN神经网络并加以训练、仿真和测试.  相似文献   

7.
引入混合特征的最大名词短语双向标注融合算法   总被引:1,自引:0,他引:1  
李业刚  黄河燕  鉴萍 《自动化学报》2015,41(7):1274-1282
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着重要的意义. 以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语言学 特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适应性. 实验证明,采用词和基本组块混合标注单元的标注方法对汉语最大名词短语的识别 是有效的,并且其正反向识别结果具有一定的互补性, 在此基础上提出的基于"边界分歧"的双向序列标注融合算法恰能发 掘双向识别的互补性,并达到较高的融合精度.  相似文献   

8.
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习.为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词.使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系.实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法.  相似文献   

9.
针对隐马尔可夫模型无法融合分类结果权值的问题,文中提出加权观测隐马尔可夫模型(WOHMM),并给出模型中概率计算、参数学习、序列标注三个基本问题的解决算法.使用公开数据集对参数学习和序列标注问题进行仿真实验,结果表明,WOHMM的参数学习算法能得到更接近真实值的模型参数,序列标注算法的效果较优.  相似文献   

10.
传统的分步骤事件抽取方法中,事件元素识别的结果无法指导事件类型识别,而事件类型识别的效果在很大程度上决定了事件抽取系统的整体性能。文中为解决事件类型识别对元素识别的后向依赖问题,将事件抽取看作序列标注,构建一个改进的条件随机域联合标注模型,将事件类型和事件元素在图模型中同时进行标注。同时,通过触发词嵌入试图解决事件抽取中的数据不平衡问题。ACE 2005中文语料上的实验表明,基于该模型的方法提高了事件类型识别的性能,最终F值达到63。53%。  相似文献   

11.
杨震  王红军 《计算机应用》2019,39(3):675-680
针对Markov模型在位置预测中存在预测精度不高及匹配稀疏等问题,提出了一种基于Adaboost-Markov模型的移动用户位置预测方法。首先,通过基于转角偏移度与距离偏移量的轨迹划分方法对原始轨迹数据进行预处理,提取出特征点,并采用密度聚类算法将特征点聚类为用户的各个兴趣区域,把原始轨迹数据离散化为由兴趣区域组成的轨迹序列;然后,根据前缀轨迹序列与历史轨迹序列模式树的匹配程度来自适应地确定模型阶数k;最后,采用Adaboost算法根据1~k阶Markov模型的重要程度为其赋予相应的权重系数,组成多阶融合Markov模型,从而实现对移动用户未来兴趣区域的预测。在大规模真实用户轨迹数据集上的实验结果表明,与1阶Markov模型、2阶Markov模型、权重系数平均的多阶融合Markov模型相比,Adaboost-Markov模型的平均预测准确率分别提高了20.83%、11.3%以及5.38%,且具有良好的普适性与多步预测性能。  相似文献   

12.
燃气负荷预测受到社会经济、天气因素、日期类型等多种复杂因素的影响,而多因素的共同作用则必然会导致燃气负荷序列变化趋势具有很大的随机性以及一定程度上的复杂性.为了有效提高燃气负荷预测的精度,本文提出了一种新型的集成深度算法来对燃气负荷进行多步预测.首先通过EEMD算法将非平稳非线性的负荷序列分解为若干个稳态且线性的本征模式分量及剩余项,有效的避免了传统EMD带来的模态混叠问题,然后将负荷数据的影响因素输入到AutoEncoder中进行特征提取并做非线性降维处理,再将EEMD分解得到的每个子序列分别与AutoEncoder提取到的特征序列组成不同的训练矩阵,最后针对不同的子序列对应的训练矩阵建立相应的LSTM预测模型,重构分量预测值得到最终预测结果.为了验证所提出算法的有效性和预测性能,使用上海燃气数据来进行上述模型的仿真实验,结果证明相较对比方法,预测精度有了明显的提高.  相似文献   

13.

An improved global shared-layer blending method (GSLB) is suggested to address the constrained-manufacturable stacking sequence design optimization problem of tapered composite structures. First, the mathematical model for tapered composite structures design problem is constructed and the effect of blending constraint on the design space is analyzed. By introducing the set theory, the original GSLB method is improved by aggregating a shape prediction algorithm and a thickness evaluation procedure. The shape prediction algorithm takes advantage of the set computation procedure, which simplifies the process for detecting the shared layers’ boundaries. The maximum blending shared layers are evaluated by the improved GSLB in terms of the thickness distribution of multiple ply orientations. Subsequently, the obtained shared-layers are served as integrated variables for stacking sequence design, in which complex manufacturing constraints are involved. Three multi-panel structures and a wing box structure are adopted to verify the improved GSLB method and stacking sequence design strategy, and perfectly blended solutions are found without violation of manufacturing constraints and mechanical requirements. Finally, the 98 line Matlab code of the improved GSLB method is provided for the convenience of engineering application. This research has two purposes: providing a technique for tailoring design of tapered composite structures and giving reference solutions for constrained-manufacturable stacking sequence design optimization problem.

  相似文献   

14.
摘 要: 多维分类根据数据实例的特征向量将数据实例在多个维度上进行分类,具有广泛的应用前景。在多维分类算法的模型学习过程中,海量的训练数据使得准确的分类算法需要很长的模型训练时间。为了提高多维分类的执行效率,同时保持高的预测准确性,本文提出了一种基于贝叶斯网络的多维分类学习方法。首先,将多维分类问题描述为条件概率分布问题。其次,根据类别向量之间的依赖关系建立了条件树贝叶斯网络模型。最后,根据训练数据集对条件树贝叶斯网络模型的结构和参数进行学习,并提出了一种多维分类预测算法。大量的真实数据集实验表明,本文提出的方法与当前最好的多维分类算法MMOC相比,在保持高准确性的同时将模型的训练时间降低了两个数量级。因此,本文提出的方法更适用于海量数据的多维分类应用中。  相似文献   

15.
The identification of dynamic models which relate power and frequency deviations on a tie line of a power system is investigated. The identification problem is posed and three identification algorithms are presented which produce least squares models with different structural properties. Model order is determined by applying residual and system structure tests to a sequence of models of increasing order. These tests indicate the model order for both equivalent realizations and predictive models. Equivalent realizations are identified on one data set and then their performance as a dynamic equivalent is evaluated on a second data set. These equivalent realizations are also used to predict frequency in an iterative frequency prediction algorithm. Predictive models are also identified and their performance as frequency predictors is evaluated using a direct prediction algorithm. The identification of dynamic equivalents provides information about the structural properties of power systems. The use of dynamic equivalents and predictive models for frequency prediction indicates the tradeoff in accuracy vs the prediction interval which can be obtained using these least squares algorithms and the measurement device presently available.  相似文献   

16.
径向基函数(RBF)神经网络的一种极大熵学习算法   总被引:12,自引:0,他引:12  
RBF神经网络中心向量的确定是整个网络学习的关键,该文基于信息论中的极大熵原理构造了训练中心向量的极大熵聚类算法,由此给出了网络的极大熵学习算法。文中最后分别用一个时间序列预测和系统辨识问题验证了该学习算法的有效性,同RBF网络和多层感知机的误差回传算法相比,该算法不仅在学习精度和泛化推广能力上有一定程度的提高,而且学习时间有显著的降低。  相似文献   

17.
近年来,机器学习技术飞速发展,并在自然语言处理、图像识别、搜索推荐等领域得到了广泛的应用.然而,现有大量开放部署的机器学习模型在模型安全与数据隐私方面面临着严峻的挑战.本文重点研究黑盒机器学习模型面临的成员推断攻击问题,即给定一条数据记录以及某个机器学习模型的黑盒预测接口,判断此条数据记录是否属于给定模型的训练数据集....  相似文献   

18.
摘要:在蛋白质结构预测的研究中,一个重要的问题就是正确预测二硫键的连接,二硫键的准确预测可以减少蛋白质构像的搜索空间,有利于蛋白质的3D结构的预测。本文将一个蛋白质结构中二硫键的预测问题,等价为一个寻找图的最大权的匹配问题。图的顶点表示序列中的半胱氨酸残基,边连接每一顶点,表示一种可能的连接方式,边的权根据一个权值函数赋值,用EJ算法寻找具有最大权的匹配,则这个匹配对应二硫键的正确连接。应用这个方法对蛋白质结构的二硫键进行了预测取得了良好的结果。  相似文献   

19.
A modification of the estimation algorithm stochastic approximation is presented. With assumptions to the statistical distribution of the training data it becomes possible, to estimate not only the mean value but also well directed deviating values of the data distribution. Thus, detailed error models can be identified by means of parameter-linear formulation of the new algorithm. By definition of suitable probabilities, these parametric error models are estimating soft error bounds. That way, an experimental identification method is provided that is able to support a robust controller design. The method was applied at an industrial robot, which is controlled by feedback linearisation. Based on a dynamic model realised by a neural network, the presented approach is utilised for the robust design of the stabilising decentral controllers.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号