首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究相关联,设计出一种基于潜在狄利克雷分配和潜在语义树模型的文本处理方法,可针对不同类型的医学文本生成有一定可读性的自动批注。该方法形成的自动批注主观性低,其准确度和可读性均高于关键词模型的处理结果,可辅助医生进行医学文本的批注和分类,从而减轻其工作量。程序结果表明,该方法目前可应用于对医学图像所见形成诊断意见、对病人病历进行摘要形成和对病症描述给出对症处方等方面,批注的语义匹配度可达67.7%,文本的平均可读性为60.02%。  相似文献   

2.
为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模型,使其对评论原文的句首具有更高的注意力权重,并可端到端地生成评论摘要的每一个词.实验结果表明,该模型在对英文同类别全文长度小于200的评论摘要提取上有更高的准确率.  相似文献   

3.
在通信协议的一致性测试中,寻找一条简洁高效的测试序列是关键工作之一.基于FSM模型的协议一致性测试,提出一种新的UIO序列生成方法,利用遗传算法求解UIO序列.研究结果表明,该算法能生成更短且结果稳定的UIO序列.  相似文献   

4.
扩散模型,一类基于深度学习的生成模型家族,在前沿机器学习研究中变得日益重要。扩散模型以在生成与观察数据相似样本方面的卓越性能而著称,如今广泛用于图像、视频和文本合成。近年来,扩散的概念已扩展到时间序列应用领域,涌现出许多强大的模型。鉴于这些模型缺乏系统性总结和讨论,我们提供此综述作为此领域新研究人员的基础资源,并为激发未来研究提供灵感。为更好理解,引入了有关扩散模型基础知识的介绍。除此之外,主要关注基于扩散的时间序列预测、插补和生成方法,并将它们分别在三个独立章节中呈现。还比较了同一应用的不同方法,并强调它们之间的关联(若适用)。最后,总结了扩散方法的共同局限性,并突出强调潜在的未来研究方向。  相似文献   

5.
为避免现有产生测试用例过程中隐含的不可行路径和状态爆炸问题,提出一种对基于流的序列程序产生测试用例的形式化方法。该方法定义了条件和循环覆盖准则后,通过条件演算对序列程序生成测试用例。程序执行是基于程序语义进行,避免了隐含的不可行路径,复杂度分析表明该方法可以避免状态爆炸问题。  相似文献   

6.
文本生成是人工智能和自然语言处理的重要研究领域,为人工智能生成内容的快速发展提供了关键技术支撑。该任务基于自然语言处理、机器学习和深度学习等技术,通过训练模型学习语言规则,自动生成符合语法和语义要求的文本。本文对文本生成的主要研究进展进行梳理和系统性总结,对近几年文本生成相关文献进行综合调研,并详细介绍相关技术模型。此外,针对典型文本生成应用系统进行介绍。最后,对人工智能文本生成的挑战和未来研究方向进行分析和展望。得出以下结论,提高生成文本的质量、数量、交互性和适应性有助于从根本上推动人工智能文本生成的发展。  相似文献   

7.
介绍基于电力公司的多格式文档智能信息搜索系统的设计原理和实现过程。通过PHP调用COM组件以及Java调用jar包,将其他多种文档转换为".txt"文档,经过分词并采用基于句子特征的文本摘要生成方法生成".txt"文档的摘要。检索模块采用基于词索引的全文检索,信息检索模型采用空间向量模型,实现摘要及高相关度句子的输出。  相似文献   

8.
基于区域合并与轮廓模型的图像序列人物轮廓分割   总被引:1,自引:1,他引:0  
为解决受图像背景复杂度影响,分水岭算法较难高精度实现图像序列中人物轮廓的分割与追踪这一问题,提出了利用颜色空间转换的区域合并实现目标轮廓区域的划分、并基于人物头部轮廓信息生成人物领域轮廓模型的方法。通过对人物领域边界线生成的初步轮廓模型进行高斯函数的卷积运算,生成形态轮廓模型的有效对象模板,实现图像序列的人物领域中不依靠序列差分和移动向量亦能在图像序列中追踪移动对象。基于颜色空间转换的区域合并和轮廓模型算法,可满足视频背景变动并且背景复杂的情况下对图像序列中的人物轮廓进行有效分割。实验结果验证了本算法的有效性与鲁棒性,可有效而稳定实现图像序列中人物轮廓的分割。  相似文献   

9.
为实现多语种生成式自动摘要,基于序列到序列(Seq2Seq)模型提出了一种多语种生成式自动摘要方法.首先,按照传统的多语种自动摘要方法,将中、英、朝3个语种的语料分开训练,得到3个模型,并观察各模型在测试集上的表现; 其次,按照本文提出的多语种自动摘要法,将中、英、朝3种语言的语料放在一起共同训练出一个模型,然后运用该模型分别运行中文、英文、朝文语料的测试集,并观察模型的表现; 最后,用同一个测试集测试模型改进前后的摘要生成效果.实验结果表明,本文方法生成多语种自动摘要的效果与传统方法相近,但因本文方法只用一个模型即可实现多语种自动摘要,因此更具有适用性.  相似文献   

10.
克服当前文本分类法中基于词形匹配带来的局限性,基于WordNet语义词典和隐含语义索引(LSI)模型,提出了基于语义集索引的英文文本分类方法. 该方法在分类初期首先利用WordNet构建语义词典库,利用单词的语义集代替单词作为文本特征向量的特征项;然后利用LSI模型进一步深入挖掘语义集概念间的深层联系,将语言知识和概念索引有效地融合到文本向量空间的表示中. 针对Naive Bayes及简单向量距离文本分类法的实验结果显示,2种文本分类法的分类准确率均随着语义分析的深入逐步提高,充分表明了语义挖掘对文本分类的重要性和必要性。  相似文献   

11.
针对中文零代词识别任务,提出了一种基于深度神经网络的中文零代词识别模型. 首先,通过注意力机制利用零代词的上下文来帮助表示缺省的语义信息. 然后,利用Tree-LSTM挖掘零代词上下文的句法结构信息. 最后,利用语义信息和句法结构信息的融合特征识别零代词. 实验结果表明,相对于以往的零代词识别方法,该方法能够有效提升识别效果,在中文OntoNotes5.0数据集上的F1值达到63.7%.  相似文献   

12.
目标情感分析旨在分析评论文本中不同目标所对应的情感倾向。当前,基于图神经网络的方法使用依存句法树来融入依存句法关系,一方面,此类方法大多忽略了依存关系缺乏区分度的事实;另一方面,未考虑依存句法树提供的依存关系存在目标与情感词关系缺失的问题。为此,提出双重图注意力网络模型。该模型首先使用双向长短期记忆网络得到具有语义信息的词节点表示,然后根据依存句法树在词节点表示上构建句法图注意力网络,实现依存句法关系重要程度的区分,更有效地建立目标与情感词之间的关系,进而得到更准确的目标情感特征表示;同时根据句子的无向完全图构建全局图注意力网络来挖掘目标与情感词缺失的关系,进一步提升模型的性能。实验结果表明,与现有模型对比,双重图注意力网络模型在不同数据集上的准确率与宏平均F1值均取得了更好结果。  相似文献   

13.
针对方面级情感分析任务不能充分兼顾句法全面性与语义关联性,且大多数研究中使用的图卷积仅考虑信息自上而下的传播,忽略了信息自下而上的聚合等问题,本文提出了基于注意力与双通道网络的情感分析模型.该模型在扩展依存表示的同时使用自注意力获取具有语义关联的信息矩阵,使用双通道网络结合全局句法与语义关联信息,双通道网络分别侧重于自上而下传播的语义特征与自下而上聚合的结构特征.通道内的图卷积输出会与信息矩阵进行交互注意力起到残差互补的作用,然后通过平均池化完成通道内的任务.最后将基于语义与基于结构的决策融合得到最终的情感分类特征.实验结果表明该模型在三个公开数据集上的准确率与F1值均有提升.  相似文献   

14.
基于词性标记文法的文本信息隐藏算法   总被引:1,自引:0,他引:1  
提出了以词性标记文法语言为变换域的文本信息隐藏方法。根据自然语言语法规则构造自由上下文文法,文法的句子是用词性标记符表示的句型;利用模拟函数将秘密信息变换为文法的句子;载体文本用分词与词性标记软件也变换为同一文法的句子;运用字符串匹配技术计算秘密信息句子在载体文本中的位置,位置即为密钥;接收方根据密钥提取文法的句子,再通过语法分析读出秘密信息;给出了信息隐藏容量公式。该算法不改变载体文本,能较好地解决Wayner的载体文本生成技术面临的载体文本合语法但不合语义的问题。  相似文献   

15.
在方面级情感文本中存在部分不含情感词的评论句,对其情感的研究被称为方面级隐式情感分析.现有分析模型在预训练过程中可能会丢失与方面词相关的上下文信息,并且不能准确提取上下文中深层特征.本文首先构造了方面词感知BERT预训练模型,通过将方面词引入到基础BERT的输入嵌入结构中,生成与方面词信息相关的词向量;然后构造了语境感知注意力机制,对由编码层得到的深层隐藏向量,将其中的语义和句法信息引入到注意力权重计算过程,使注意力机制能更加准确地分配权重到与方面词相关的上下文.对比实验结果表明,本文模型的效果优于基线模型.  相似文献   

16.
面向目标的情感分析是细粒度情感分析的重要任务之一,旨在预测句子中给定目标实体的情感极性.当前大多数研究方法忽略了句法结构信息,在情感判别时往往会关注无关词汇,从而使分类性能下降.为此,设计了一种新的引入句法结构的模型,该模型利用双向预训练编码器和作用于依存句法树的图卷积网络分别捕获文本的上下文信息和句法结构信息,并使用多头注意力机制进行信息聚合得到目标的情感分类表征.此外,还将该模型与现有的领域自适应方法相结合,同时向模型中引入领域知识和句法结构知识,进一步提升了模型效果.在几个常用的标准数据集上的实验结果表明了上述模型的有效性.  相似文献   

17.
以源推特文本为研究对象,深度挖掘推特正文内容的语义信息,并强调谣言在具有异质性的社交网络传播过程中存在的结构特征,以达到提升谣言检测效果的目的。采取基于One-Hot Encoding的词嵌入方法,结合Multi-head attention机制实现推特正文内容初级语义特征的提取,并进一步基于胶囊网络(CapsNet)构建内容胶囊(content-capsule)模块实现对正文内容深度语义特征的提取,结合图卷积胶囊(GCN-Capsule)模块实现谣言在社交网络中传播结构特征的提取,将两种胶囊向量采用一种动态路由机制进行融合,进一步丰富输入特征,之后输出源推特的分类结果,进而实现源推特的谣言检测。实验结果显示,该模型对谣言识别的正确率达93.6%。  相似文献   

18.
To solve the problem that the traditional automatic text summary model cannot generate a high-quality long text summary due to the limitation of the length of the RNN (Recurrent Neural Network), a model of abstractive text summarization for topic-aware communicating agents has been proposed. First, the problem that the LSTM (Long Short-Term Memory) input sequence is too long to generate the abstract with prior information has been solved by dividing the encoder into multiple collaborating agents. Then for providing topic information and improving the correlation between the generated abstract and the source text, the joint attention mechanism has been added into our model. Finally, a hybrid training method with reinforcement learning has been employed in order to solve the problem of exposure bias, and optimize the evaluation index directly. The results show that our model not only generate long text summaries with prominent themes, but also has a higher score than the state-of-the-art models, which indicates that with the help of topic information, the model for communicating agents can be expected to generate long text summaries better.  相似文献   

19.
提出了一种基于句法模式的语义关系抽取方法,用于从术语词典中抽取语义关系.该方法以句法模式为中心,结合了自然语言处理技术和统计的思想,充分利用术语词典文档中的句法信息,通过抽取包含着语义关系信息的句法模式,并将其与词典文本进行近似匹配以达到抽取语义关系的目的.实验结果表明,该方法可以有效地从术语词典中抽取多种语义关系.  相似文献   

20.
将全信息(自然语言的语法、语义和语用信息)自然语言理解应用到可靠语音功能的研究中,提出在语音识别之后增加一个全信息自然语言理解的文本后处理功能,通过深入分析词语的语法信息(位置、识别稳定度)、语义信息(语句目标含义)和语用信息(语境和谐度)对语音识别结果语句进行评估、检错和纠错,最终输出优化语句。实验结果表明,增加全信息自然语言理解后处理可使识别正确率获得较好改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号