首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 710 毫秒
1.
传统的文本信息抽取算法通常基于词典、规则或其他模型实现,但由于词典建立困难、规则设定模糊或模型结构单一等原因,信息抽取的准确性通常较低。针对传统的文本信息抽取算法存在的多种不足,提出一种基于混合模型的文本信息抽取算法。该算法融合了多种信息抽取方法,引入支持向量机对信息进行分类,利用S型函数拟合调整模型参数,并采用数据平滑技术优化模型概率空间。实验结果表明,与传统的文本信息抽取算法相比,该算法信息抽取的精确度和召回率明显提高,具有较好的可行性。  相似文献   

2.
针对实体关系抽取任务中的三元组重叠问题,基于编码器-解码器结构的联合抽取方法能够通过序列生成的方式加以解决。但现有方法没有充分利用实体类别信息,而实体类别信息对于构建更丰富的语义特征并进一步优化关系模型的效果具有重要意义。在使用编码器-解码器结构的基础上,融合实体类别信息构建实体关系联合抽取模型FETI。编码器采用经典Bi-LSTM结构,解码器采用树状解码替代传统的一维线性解码。同时,在解码阶段增加头尾实体类别的预测,并通过辅助损失函数进行约束,使模型能够更有效地利用实体类别信息。在百度公开的中文数据集DuIE上进行实验,结果表明,FETI的F1值达到0.758,相对于CopyMTL、WDec、MHS、Seq2UMTree模型提升了2.02%~9.86%,验证了融合实体类别信息对于提升实体关系抽取模型性能的有效性。此外,基于不同解码顺序和不同权重损失函数的实验结果表明,解码顺序对模型性能影响较大,而对主要任务的损失函数赋予较高权重,能够保证辅助任务为主要任务提供有效的背景知识,同时限制噪声的影响。  相似文献   

3.
针对传统视频编码技术计算量大和复杂度高的缺点,提出一种基于双边信息的分布式视频压缩感知算法。该算法将压缩感知技术与分布式视频编码技术相结合,把视频序列分为Key帧和CS帧,Key帧运用传统的帧内编码和解码,CS帧编码端运用压缩感知编码,解码端运用视频块内与视频块间的双边信息和梯度投影算法进行优化重构。通过双边信息的运动估计和压缩编码器的设计,实现基于双边信息的分布式视频压缩感知模型的构建。仿真结果表明该模型既可以实现高效编码,又可以实现复杂度由编码端向解码端转移,在较低的采样率下,提高视频的压缩能力和传输速度。  相似文献   

4.
随着大量的科研论文出现在互联网上,从中精确地抽取论文头部信息和引文信息显得十分重要。该文提出了一种基于隐马尔可夫模型的中文科研论文头部信息和引文信息抽取算法,分析了模型结构的学习和参数估计方法。在进行信息抽取时,利用分隔符、特定标识符等格式信息对文本进行分块,利用隐马尔可夫模型进行指定域的抽取。实验结果表明,该算法具有良好的准确率和召回率。  相似文献   

5.
随着因特网技术的迅速发展,网上信息成几何级数增长,如何从这些海量联机非结构化文本中自动抽取出结构化信息成为目前重要的研究课题。研究了基于隐马尔可夫模型的Web信息抽取算法,着重探讨了隐马尔可夫模型在文本信息抽取中应该如何应用,数据应该如何标记,并对隐马尔可夫模型在文本信息抽取中的应用提出了几个改进的方法,建立了基于HMM的Web信息抽取模型,并对信息抽取后的数据进行了分析对比,验证了改进算法的有效性。  相似文献   

6.
针对金融类公告中的结构化数据难以被高效快速提取的问题,提出一种基于文档结构与Bi-LSTM-CRF网络模型的信息抽取方法。自定义一种文档结构树生成算法,利用规则从文档结构树中抽取所需节点信息;构建基于信息句触发词的局部句子规则,抽取包含结构化字段信息的信息句;将字段的结构化信息抽取看作序列标注问题,分词时加入领域知识词典,构建基于Bi-LSTM-CRF的神经网络模型进行字段信息识别。实验结果表明,该信息抽取方法可以满足多类型公告的结构化信息提取,最终的信息句与字段信息抽取的平均F1值均可达到91%以上,验证了该方法在产品业务中的可行性和实用性。  相似文献   

7.
在基于Web的主题关键词查询扩展,获取候选主题句的基础上,提出一种基于LDA模型的主题句抽取方法,以抽取粒度较细的主题信息,并增加主题信息的置信度。该方法通过多个侧面对目标主题的衬托,采用LDA模型对主题信息进行建模,利用各个主题概率分布的平滑度进行候选句的可信度计算来抽取主题句。在面向Web的主题句抽取的具体应用中,取得了较好的效果。  相似文献   

8.
基于包装器模型的文本信息抽取   总被引:6,自引:0,他引:6  
在分析基于标志和基于文本模式两类算法的基础上,提出了一种新的包装器归纳学习算法。新算法综合上述两类算法的优点,不但能利用页面的标志信息进行信息定位,而且能利用文本的模式信息来进行信息抽取和对抽取结果进行必要的过滤。实验结果表明,新算法具有较高的信息抽取精度与信息表达能力。  相似文献   

9.
《微型机与应用》2017,(1):40-43
Q-STAR模型是现有的客观视频质量评价中最接近主观得分的模型,但是在解码端难以从丢包解码后的YUV视频序列中提取与编码端相一致的运动矢量信息,从而影响模型参数的预测。针对该问题,提出了基于视敏度信息的模型参数预测方法,从YUV视频序列中提取时间域和空间域视敏度特征,并结合Q-STAR模型中提取的特征进行预测。通过实验发现,使用视敏度信息代替原有的运动矢量信息进行预测,所得模型参数值与Q-STAR基本相符,并且计算更为简单。  相似文献   

10.
现有的信息抽取工作多是针对无层次结构的数据信息,而在实际任务中,文本中的数据常常具有复杂的嵌套层次结构,如文档中包含多个不同类型的信息块序列,每个块中又包含了一个独立的信息序列.针对具有层级结构的信息抽取问题,提出一种基于联合序列标注的层级信息抽取方法.一方面使用BiLSTM-CNN-CRF模型分别对不同层级的数据进行建模,另一方面通过联合学习方法实现层次级的信息抽取,使得不同层次的信息抽取任务能够同时而有效地进行信息交互和独立抽取,提高了信息抽取任务的准确率.  相似文献   

11.
Adaptive sequential estimation with unknown noise statistics   总被引:8,自引:0,他引:8  
Sequential estimators are derived for suboptimal adaptive estimation of the unknown a priori state and observation noise statistics simultaneously with the system state. First- and second-order moments of the noise processes are estimated based on state and observation noise samples generated in the Kalman filter algorithm. A limited memory algorithm is developed for adaptive correction of the a priori statistics which are intended to compensate for time-varying model errors. The algorithm provides improved state estimates at little computational expense when applied to an orbit determination problem for a near-earth satellite with significant modeling errors.  相似文献   

12.
提出一种基于在线模型匹配与更新的人脸三维表情运动跟踪算法。利用自适应的统计观测模型建立在线模型,自适应的状态转移模型结合改进的粒子滤波同时进行确定性搜索和随机化搜索,并且融合目标的多种测量信息减少光照和个体相关性的影响。利用所提出的算法既可以得到全局刚体运动参数,又可以得到局部柔性表情参数。实验证明了该算法的有效性。  相似文献   

13.
基于最大熵马尔可夫模型的地址信息抽取   总被引:3,自引:0,他引:3  
互联网的迅速发展,以及人们对于信息需求的提高,使得网络信息的自动处理和挖掘成为了研究热点。在与网络文本相关的信息抽取任务中,观察值序列都是给定的,所以不需要考虑得到观察值的概率,而只需要关注观察值引起的状态转移的概率。最大熵马尔可夫通过改变概率转移函数,使得状态的转移与输入值以及前一状态相联系,很好地体现了序列的上下文信息。通过最大熵马尔科夫模型进行地址信息抽取,精确度和召回率都得到了很大的改进。  相似文献   

14.
针对K-means等聚类方法在脑网络状态观测中稳定性和鲁棒性较差的缺点,提出了一种基于瞬时转变率模型的脑网络状态观测算法。通过对状态转换临界点进行分组统计和分析,计算每一个临界时间点的状态瞬时转变率,在此基础上构建脑网络状态观测算法,并使用区间估计方法对状态转换的观测效果进行估计和验证。在脑网络数据库样本中的实验结果显示,与K-means等脑网络状态聚类观测算法相比,该算法在不同条件下的聚类稳定性更好,对样本差异的适应性更强,受参数选择的影响更小,能直观地观测到脑网络状态转换趋势。  相似文献   

15.
针对传感器的故障诊断与故障数据重构问题,提出一种基于改进型长短期记忆网络(LSTM)和随机森林(RF)的混合算法.首先,运用改进型LSTM算法对传感器的输出序列进行预测,将预测值与实际值作差得到残差序列.然后,通过RF算法对残差序列进行分类,识别出传感器的故障状态.当传感器诊断的结果为故障工作状态时,利用改进型LSTM的预测值重构故障数据.所提的改进LSTM-RF算法在功能上既可以对传感器故障类型进行诊断,又可以对故障数据进行重构.实验结果表明,改进的LSTM-RF算法的传感器故障识别准确率在不同的数据集上均能大于97%,故障数据重构的均方根误差小于4%;相比标准的LSTM-RF算法,改进的LSTM-RF算法在收敛速度提高的同时故障数据重构的精度提高了0.4%.  相似文献   

16.
In this paper, parameter estimation of a state-space model of noise or noisy speech cepstra is investigated. A blockwise EM algorithm is derived for the estimation of the state and observation noise covariance from noise-only input data. It is supposed to be used during the offline training mode of a speech recognizer. Further a sequential online EM algorithm is developed to adapt the observation noise covariance on noisy speech cepstra at its input. The estimated parameters are then used in model-based speech feature enhancement for noise-robust automatic speech recognition. Experiments on the AURORA4 database lead to improved recognition results with a linear state model compared to the assumption of stationary noise.   相似文献   

17.
在机动目标跟踪中,用于模型辨识和状态估计的非线性滤波器的合理选择和优化是提升滤波精度的关键.融合量测迭代更新集合卡尔曼滤波和交互式多模型(interacting multiple models,IMM)方法,本文提出了基于量测迭代更新集合卡尔曼滤波的机动目标跟踪算法.通过迭代更新思想的引入构建了一种量测迭代更新下集合卡尔曼滤波的实现结构,并将其作为IMM的模型滤波器实现对于目标运动模式和状态的辨识与估计.针对算法结合过程中滤波精度和计算量的平衡,设计了用于输入交互环节的状态估计样本,同时简化输入交互环节和输出交互环节中滤波误差协方差矩阵的交互过程.理论分析和仿真结果验证了算法的可行性和有效性.  相似文献   

18.
确定类的测试顺序是面向对象程序测试中的关键步骤。描述对象关系图模型,提出一种基于对象关系图的类间集成测试顺序改进算法,与Tai和Traon等人提出的算法相比,该算法需要的测试桩较少、效率较高。在Redflag4系统下用Kylix3(C++)对算法进行实现。理论分析和初步实验证明了该算法的可行性和有效性。  相似文献   

19.
Hidden Markov models (HMMs) perform parameter estimation based on the forward–backward (FB) procedure and the Baum–Welch (BW) algorithm. The two algorithms together may increase the computational complexity and the difficulty to understand the algorithm structure of HMMs clearly. In this study, an increasing mapping based hidden Markov model (IMHMM) is proposed. Between the observation sequence and possible state sequence an increasing mapping is established. The re-estimation formulas for the model parameters are derived straightforwardly based on these mappings instead of FB variables. The IMHMM has simpler algorithm structure and lower storage requirement than the HMM. Based on IMHMM, an expandable process monitoring and fault diagnosis framework for large-scale dynamical process is developed. To characterize the dynamic process, a novel index considering serial correlation is used to evaluate process state. The presented methodology is carried out in Tennessee Eastman process (TEP). The results show improvement over HMM in terms of memory complexity and training time of the model. Also, the power of IMHMM can be observed compared with principal component analysis (PCA) based methods.  相似文献   

20.
IEKF滤波在移动机器人定位中的应用   总被引:1,自引:0,他引:1  
针对EKF中观测噪声方差估计不准确导致滤波器性能下降甚至发散的问题,提出了基于环境特征的迭代扩展卡尔曼滤波(IEKF)融合算法。该算法融合了里程计采集的机器人内部数据和激光雷达传感器采集的外部环境特征,在测量更新阶段多次迭代状态估计值并对机器人的位姿进行修正,减少了非线性误差,提高了定位精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号