首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
为了对半结构化文本实现自动抽取信息.介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则.给出了一种能描述不符合英文词法的词的模式匹配约束.试验表明:在特征简单的抽取规则学习中,该方法精确度与召回率可达100%.在特征比较复杂的抽取规则学习中,该方法F1评估值也能达到80%以上.  相似文献   

2.
针对现有图像描述生成算法在解码阶段由于语言模型结构简单,解码表达能力较弱,容易造成语义缺失的问题,引入有序长短时记忆网络(ON-LSTM),改进现有模型解码器,构建双层LSTM架构,显式的提取描述文本层级结构,解码出更丰富的语义特征。在MSCOCO数据集上进行训练和测试,实验结果表明,改进的算法能够生成更加符合自然语言习惯的描述语句。  相似文献   

3.
传统基于序列的文本摘要生成模型未考虑词的上下文语义信息,导致生成的文本摘要准确性不高,也不符合人类的语言习惯.本文提出了一种基于文本语义结构的文本摘要生成模型(Structure Based Attention Sequence to Sequence Model,SBA),结合注意力机制的序列到序列生成模型,引入文本...  相似文献   

4.
基于XML的Web中文文本挖掘系统设计   总被引:1,自引:0,他引:1  
语料本的挖掘和本语料库的建设对语言学研究具有重要意义,因此语料本的挖掘和本语料库的建设就越来越值得探讨。但由于Web上本的半结构化特征和异构本源的问题,在Web上的本挖掘具有很多困难。本提出了将XML技术与Web挖掘技术相结合,根据研究的个人需求定制个性化的Web中本挖掘系统框架和实现方案,并给出了面向法律领域的Web本挖掘系统Laws Miner的实例。  相似文献   

5.
为了揭示SWF文件格式的隐含属性,基于对象交换模型(OEM)的构建方式,提出了一种增强半结构化模型E-OEM,可对SWF文件格式进行描述和存储.采用OEM进行SWF文件格式的描述;对OEM描述模型进行改进,采用头尾分类、文件体聚类的思想将相同类别标签作为一类;通过引入Huffman编码,实现E-OEM具有描述和存储的功能.随机选择百例不同源文件进行E-OEM建模,仿真实验结果表明,所提模型不仅可以将隐含属性显性表示,同时提高了具有高标签重复率的文件存储效率,证实了模型的有效性.  相似文献   

6.
针对文本信息隐藏嵌入容量低和语义连贯性差的问题,提出了一种基于神经网络图像描述的文本信息隐藏模型.将卷积神经网络与长短期记忆网络相结合,把图像特征和生成语句进行关联.从收发双方能否共享图像及模型参数的不同应用前提出发,设计了多种概率采样方式,从而生成载密的图像描述文本.实验结果表明,该算法具有较高的隐藏容量,载密描述句能较好地表达图像内容.该模型归属于"无载体"自然语言生成式信息隐藏,具有较好的隐蔽性和安全性.  相似文献   

7.
基于改进语言表示,通过预训练模型ERNIE,根据上下文计算出文本数据向量表示.使用LCNN模型对该向量表示进行标注.该方法与CNN、FastText、BERT、BiLSTM、Transformer算法等在准确率、召回率、F1值等评价指标上进行了仿真对比.  相似文献   

8.
针对招标文件中因数据稀疏导致的特征提取困难影响分类准确率的问题,提出了一种基于极端梯度提升(eXtreme gradient boosting,XGBoost)和文本聚焦表示模型的分类方法.聚焦表示部分通过提取对分类结果有显著影响的关键字段部分,使用N-Gram分词,结合词性级词频-逆文档频率(term frequen...  相似文献   

9.
在公检法、纪检监察等领域的大数据分析中,结构化数据和非结构化文本数据往往成为主要数据源. 基于这类数据进行业务分析时,需要重点提取数据背后的隐型关联,而事件抽取是对此类文本数据进行关联分析的核心基础. 过往事件抽取任务将事件触发词识别和事件要素识别分开进行,由事件触发词识别得到的事件触发词及事件类型进行后续的事件要素识别,存在误差传播的问题,且以往的基于表示的方法构建的词向量,对于句子级特征的提取能力存在缺失. 提出了一种RBBLC联合抽取模型,以序列标注的方式同时完成事件识别和事件要素识别. 所提RBBLC模型基于RoBERTa构建包含更丰富上下文信息的词向量,继而应用BiLSTM-CNN的网络结构捕捉语句内部关联信息进行事件触发词及论元标签预测和事件类型预测. 在CEC语料库上进行了抽取实验和归纳分析,本方法的F1值、准确率、召回率三项指标较基线方法分别提高了16%、28%和24%,有效提升了事件抽取任务性能.  相似文献   

10.
为解决单一的卷积神经网络(CNN)缺乏利用上下文本信息与单一循环神经网络(RNN)对局部信息把握不全面问题,提出一种基于注意力机制的多通道TextCNN-BiGRU分类模型.首先,通过word2vec对初始文本向量化,经实验选取窗口值组成三通道.然后利用CNN的强学习能力提取局部特征,利用双向门控循环单元(BiGRU)提取上下文全局信息,运用注意力层与池化层获取并优化重要的特征.最后采用softmax函数使误差loss极小化.仿真实验结果表明,提出的模型分类性能,准确度达94%,损失函数值稳定在0.22%左右,具有良好的泛化能力,能够有效解决单一模型挖掘信息不全问题,有效提高分类效果.  相似文献   

11.
煤炭供应链的工作流描述方法   总被引:2,自引:0,他引:2  
针对流程供应链结构描述问题,对供应链构成体进行了分解,用链节、子链、过程、子过程等作为供应链的基本构成体,为供应链建模提供一种描述型语言;对供应链工作流进行形式化定义,用工作流图、前趋链节、前趋链集等的概念定义为下一步的流程供应链建模及分析提供了概念自包的方法;结合上述方法以煤炭流程供应链中物流为对象,进行工作流建模,为流程供应链的描述及分析提供了一种形式化的工具.  相似文献   

12.
基于神经网络的结构分析与设计   总被引:5,自引:1,他引:5  
对神经网络的基本概念及其在结构工程中应用的可行性进行了阐述,对基于神经网络的结构分析、结构初始设计的理论与计算方法进行了研究,并通过数值算例验证了该理论有效性和准确性。  相似文献   

13.
为了解决单一卷积神经网络(CNN)缺乏利用文本上下文信息的能力和简单循环神经网络(RNN)无法解决长时依赖的问题,提出CNN-BiLSTM网络引入注意力模型的文本情感分析方法。首先利用CNN的特征强学习能力提取局部特征,再利用双向长短时记忆网络(BiLSTM)提取上下文相关特征的能力进行深度学习,最后,增加注意力层获取重要特征,使模型提取到有效的特征。在IMDB数据集上Accuracy值和均方根误差(RMSE)值分别达到90.34%和0.296 7,在Twitter数据集上Accuracy值和RMSE值分别达到76.90%、0.417 4,且模型时间代价小。结果表明,本文提出的模型有效提升了文本分类的准确率。  相似文献   

14.
话语分析在西方学界已有半个多世纪的研究历史,然而美国和英国的学们都使用着不同的术语,或对同一术语给出不同的意义,也有不同的研究方法,美国和英国的两个学派所做的不同研究实际上不是对立的,而是互补的。  相似文献   

15.
基于灵敏度分析的机枪结构动力修改研究   总被引:1,自引:0,他引:1  
介绍了机械结构灵敏度分析的基本理论,探讨了用有限元法进行结构优化和灵敏度分析的一般过程.以某型机枪的枪架为例建立了有限元结构分析模型,选择枪架的弯曲刚度、扭转刚度和整枪的第一阶固有频率为性能约束,根据灵敏度分析结果,按高强度、轻质量的要求,选择出有效的设计变量进行了重量最轻和性能最优的结构优化.同时,利用试验测试数据对优化前后武器的动态响应进行了仿真对比.结果表明,优化后武器的射击频率与固有频率的匹配更加合理,提高了武器的射击精度.  相似文献   

16.
为了对老旧砖烟囱进行隐患分析,解决其裂缝补偿及抗震加固等问题,本文结合太钢第一炼钢平炉车间3座67m高砖烟囱抗震加固的工程实例,概要记述了烟囱结构及实测动力资料,通过强度计算与分析,评定了烟囱的可靠性,针对所提加固方案,在3组烟囱模型试件的动静力对比试验研究基础上,论证了烟囱竖向裂缝的危险性,肯定了烟囱的加固效果;实测计算结果与试验所得规律基本符合,加固方案可行。  相似文献   

17.
复共线Gauss-Markov模型参数估计的最小描述长度方法   总被引:1,自引:0,他引:1  
Gauss—Markov模型是多元数据分析处理工作中常用的模型,其参数估计与筛选一直是研究的热点。当Gauss—Markov模型的设计矩阵存在复共线性时,常用主成分分析方法来筛选和估计其参数,消去它们之间的复共线性,提高估计准确度。基于最小描述长度原理,提出了一种新的参数筛选估计方法。该方法应用最小描述长度原理选择主成分作为参数,其参数的可靠性较高;从信息的角度看,这种方法的信息损失最小。最后实例说明了该方法的有效性和可靠性。  相似文献   

18.
提出了一种基于BP神经网络和主成分分析的文本分类模型。该模型利用主成分分析实现对特征矩阵的降维,通过大量的模拟实验逐步优化BP网络的各项参数。在20_newgroups数据集上的模拟实验表明,该模型具有较好的性能并能得到较高的分类精度。  相似文献   

19.
提出了一种基于BP神经网络和主成分分析的文本分类模型。该模型利用主成分分析实现对特征矩阵的降维,通过大量的模拟实验逐步优化BP网络的各项参数。在20_newgroups数据集上的模拟实验表明,该模型具有较好的性能并能得到较高的分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号