共查询到20条相似文献,搜索用时 62 毫秒
1.
一、引言句法分析是自然语言处理的重要基础,相应的研究很多,但是由于速度问题,句法分析很难大规模运用,因此提高分析速度一直是句法分析的重要研究方向。我们知道,句法分析的过程实际上是一个在句法成分树的空间中寻找最优分析树的过程,因此可以把分析过程看成是个搜索最佳路径的过程。在搜索的过程中给些“启发”将提高效率。双向图算法,是个最佳的例证,由于每条规则都有触发类来规定它的使用时机,使得它无论是时间还是空间上都比传统的图算法有更高的效率。 相似文献
2.
3.
4.
可逆变换和双向变换等数据转换问题一直是近年来的研究热点,研究人员针对该问题提出了大量相关的语言和模型。但是,这些实现往往建立在一种新的计算模型上,从而导致需要花费较大的学习成本去了解计算模型。另一方面,作为语法解析的基本工具,上下文无关文法对于绝大多数程序员来说都是不陌生的。提出了一种基于上下文无关文法的计算模型,用来构造字符串上的可逆变换,并对其性质和表达能力进行了探讨。采用Scheme语言实现了该计算模型,并通过在MIPS指令集上进行汇编和反汇编开发验证了该模型。验证结果表明,该模型具有较强的表达能力,在添加小型的公共数值变换模块后,可以完整地实现MIPS指令集上的汇编和反汇编。 相似文献
5.
给出基于量子逻辑的下推自动机(e-VPDA)的概念,提出广义的子集构造方法,进而证明了一般的e-VPDA与状态转移为分明函数且具有量子终态的e-VPDA的等价性.利用此等价性,给出了量子上下文无关语言的代数刻画与层次刻画,并籍此证明了量子上下文无关语言关于正则运算的封闭性.最后,说明了量子下推自动机和量子上下文无关文法(e-VCFG)的等价性. 相似文献
6.
本文分析了分布式交互仿真系统中仿真类体系结构的特点,提出一种基于上下文无关文法的仿真类体系的形式化定义方法,并讨论了仿真类树的精炼以及仿真类的组合运算. 相似文献
7.
8.
并行性分析技术一般通过对程序的控制与数据流图或相关依赖图的分析来实现,因而需要从程序中抽取出相应依赖图的算法的支持.本文基于上下文相关图文法RGG形式框架,定义了一种任务级的并行编程图语言GPPL来直接描述顺序或并行程序的控制与数据流图,而且设计了相应的并行性分析算法以挖掘GPPL图程序的并行性特征.GPPL图语言可视为并行程序设计与程序代码生成之间的协同语言,从而使并行性挖掘避免了从程序中抽取出相应依赖图的过程.与已有的描述顺序或并行程序的图语言及其分析算法相比,GPPL图程序形式更为简洁和直观,易于设计,描述能力也更强;基于GPPL图的并行性分析算法的分析能力更强,而且具有可扩展性. 相似文献
9.
上下文相关图文法是描述可视化语言的形式化工具.为了直观地刻画并高效地分析可视化语言,已有图文法形式框架均着重于文法形式和分析算法的研究,而忽略了对它们之间表达能力的分析.在对已有上下文相关图文法形式框架的关键特征进行分析和归纳的基础上,通过构造不同形式框架之间的转换算法,揭示并形式化证明了它们表达能力之间的关系.而且,转换算法在不同形式框架之间建立了关联,使图文法的应用不必再局限于一个框架,而是可以选择不同框架分别进行图的描述和分析,从而提高了上下文相关图文法的易用性. 相似文献
10.
基于产生式集划分的上下文无关语言句子生成 总被引:2,自引:0,他引:2
给出了上下文无关文法(context-free grammar,简称CFG)产生式集的一种划分方法,可将产 生式分为两类.使用一类产生式进行推导时,推导过程将无限进行下去;使用另一类进行推导 时,推导过程将迅速结束.证明了CFG句子生成过程一定是先使用一类产生式使生成的句型不 断变长、变复杂,再使用另一类产生式使句型变成句子.据此,提出了一种可控制的通用句子 生成方法.其生成一条句子的时间和空间复杂度是O(r+n),其中n是生成句子的长度或深度 限制 相似文献
11.
以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,短语正确率与召回率在封闭测试和开放测试中分别达到75.17%、73.69%和65.06%、56.55%。 相似文献
12.
针对图像检索中多特征综合描述子维度过高且综合权值难以确定的缺点,提出一种新的基于增强微结构和上下文相似度的图像检索方法。首先,使用一种新的局部模式映射来创建过滤图;然后,基于该图上的颜色共生关系提取增强微结构描述子,该描述子综合了多种特征而维度与单特征相同,检索时使用此描述子计算图像对间的规范距离得出初始的有序相似图像序列;最后,结合迭代上下文相似度对检索序列进行重新排序。当迭代次数为50且考虑前24幅结果图像时,在Corel-5000和Corel-10000图像集上的实验结果显示,所提方法与同类型的多重基元直方图(MTH)和微结构描述子(MSD)方法相比,检索查准率分别提高了13.14%、7.09%和11.03%、6.8%。结果表明新方法能在维度不变的情况下综合多种特征并充分利用上下文信息,从而有效提高图像检索的准确率。 相似文献
13.
现有的生物医学命名实体识别方法没有利用语料中的句法信息,准确率不高.针对这一问题,提出基于句法依存分析的图网络生物医学命名实体识别模型.首先利用卷积神经网络(CNN)生成字符向量并将其与词向量拼接,然后将其送入双向长短期记忆(BiLSTM)网络进行训练;其次以句子为单位对语料进行句法依存分析,并构建邻接矩阵;最后将Bi... 相似文献
14.
15.
针对动态信任网络中企业信任联盟的识别及演变问题,提出一种基于片段的演化图聚类(GC)算法。首先,通过考虑企业信任网络演化的时间信息来对信任网络进行编码;其次,构建划分和表示信任网络结构编码成本的评价函数,如信任联盟稳定则将该时间段内信任网络组成片段压缩表示,如联盟突变则开始新的信任网络片段并重新划分结构;最后,通过搜索最小编码成本,得到信任联盟的稳定结构和结构突变的时间点。仿真实验表明,所提算法能有效识别信任联盟及其结构的突变,且其准确性和运行效率均高于经典社区发现算法。 相似文献
16.
软件安全的根源在于软件开发人员开发的源代码,但随着软件规模和复杂性不断提高,仅靠人工检测漏洞代价高昂且难以扩展,而现有的代码分析工具有较高的误报率与漏报率。为此,提出一种基于关系图卷积网络(RGCN)的自动化漏洞检测方法以进一步提高漏洞检测的精度。首先将程序源代码转换为包含语法、语义特征信息的CPG;然后使用RGCN对图结构进行表示学习;最后训练神经网络模型预测程序源代码中的漏洞。为验证所提方法的有效性,在真实的软件漏洞样本上开展了实验验证,结果表明所提方法的漏洞检测结果的召回率和F1值分别达到了80.27%和63.78%。与Flawfinder、VulDeepecker和基于图卷积网络(GCN)的同类方法相比,所提方法的F1值分别提高了182%、12%和55%,可见所提方法能有效提高漏洞检测能力。 相似文献
17.
针对虚假评论检测中不能充分利用评论的非语义特征的问题,提出了一种新的基于层次注意力机制与异构图注意力网络的层次异构图注意力网络(HHGAN)模型.首先,通过层次注意力机制学习评论文本中词级别和句级别的文档表示,重点捕获对虚假评论检测有重要意义的单词和句子;然后,将学习到的文档表示作为节点,并选取评论中非语义特征作为元路... 相似文献
18.
19.
文本分割的主要任务是将文本按照主题相关的原则划分为若干个相对独立的文本块。针对现有文本分割模型提取文本段落结构信息、语义相关性及上下文交互等细粒度特征的不足,提出了一种基于图卷积网络(GCN)的文本分割模型TS-GCN。首先,基于文本段落的结构信息与语义逻辑构建出文本图;然后,引入语义相似性注意力来捕获文本段落节点间的细粒度相关性,并借助GCN实现文本段落节点高阶邻域间的信息传递,以此增强模型多粒度提取文本段落主题特征表达的能力。将所提模型与目前常用作文本分割任务基准的代表模型CATS及其基础模型TLT-TS进行对比。实验结果表明在Wikicities数据集上,TS-GCN在未增加任何辅助模块的情况下比TLT-TS的评价指标Pk值下降了0.08个百分点;在Wikielements数据集上,相较于CATS和TLT-TS,所提模型的Pk值分别下降了0.38个百分点和2.30个百分点,可见TLT-TS取得了较好的分割效果。 相似文献