首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
框架排歧是根据句子中目标词的上下文语境,从框架库中为该目标词自动选择一个合适的框架。该任务在一定程度上解决了动词中一词多义的现象。该文基于词语及句子的分布式表征,提出了基于距离和基于词语相似度矩阵的框架排歧模型。与传统方法相比,该模型有效避免了人工选择特征,克服了特征空间维度过高、特征之间没有关联性等缺点,使框架排歧的准确率达到65.71%。并与当前最好的模型,进行显著性和一致性检验,进一步验证了词分布式表征对框架排歧任务的有效性。  相似文献   

2.
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。  相似文献   

3.
由于汉语框架网(CFN)的词元覆盖不全,使得CFN不能在大规模真实的文本中进行框架语义分析。框架语义学通过建立框架来解释词语的意义,框架与词语具有一定的语义相关性,而现有的方法在词元扩充任务中往往忽略了这种语义相关性。为此,提出一种融合框架表示的神经网络模型用于CFN词元扩充。利用双向LSTM对词语的词典释义和框架名进行建模,采用注意力机制得到与框架相关的词典释义表示;将框架语义表示和词典释义表示融合,从而得到词典中每个词的得分,输出得分高的词语。实验结果表明,该方法有效提高了CFN词元扩充的准确率,且优于基线模型。  相似文献   

4.
框架消歧指的是在给定的句子中根据目标词的上下文语境,自动识别出有歧义的目标词所属的框架。针对传统FrameNet框架消歧方法使用单一分类模型时没有考虑到目标词之间的联系而导致隐性特征难以被提取,以及分类结果比较依赖分类模型的性能及参数的设置的问题,提出了一种基于SVM和CRF双层模型的FrameNet框架消歧方法。该方法利用分治思想将框架消歧问题转化为对目标词的分类及序列标注。第一层SVM模型对输入的语料进行粗分类,得到分类标签序列;第二层CRF模型将文本序列和SVM模型的分类标签序列作为输入,将分类标签加入特征模板进一步进行序列标注。实验选取了FrameNet语义知识库中能够激起多个框架的18个词元,2?614条例句作为实验数据。实验结果显示,与传统方法相比,基于SVM和CRF的双层模型有较高的准确率,证明了该方法是一种较为适用的FrameNet框架消歧方法。  相似文献   

5.
分布式词表示学习旨在用神经网络框架训练得到低维、压缩、稠密的词语表示向量。然而,这类基于神经网络的词表示模型有以下不足: (1) 罕见词由于缺乏充分上下文训练数据,训练所得的罕见词向量表示不能充分地反映其在语料中的语义信息; (2) 中心词语的反义词出现于上下文时,会使意义完全相反的词却赋予更近的空间向量表示; (3) 互为同义词的词语均未出现于对方的上下文中,致使该类同义词学习得到的表示在向量空间中距离较远。基于以上三点,该文提出了一种基于多源信息融合的分布式词表示学习算法(MSWE),主要做了4个方面的改进: (1) 通过显式地构建词语的上下文特征矩阵,保留了罕见词及其上下文词语在语言训练模型中的共现信息可以较准确地反映出词语结构所投影出的结构语义关联; (2) 通过词语的描述或解释文本,构建词语的属性语义特征矩阵,可有效地弥补因为上下文结构特征稀疏而导致的训练不充分; (3) 通过使用同义词与反义词信息,构建了词语的同义词与反义词特征矩阵,使得同义词在词向量空间中具有较近的空间距离,而反义词则在词向量空间中具有较远的空间距离; (4) 通过诱导矩阵补全算法融合多源特征矩阵,训练得到词语低维度的表示向量。实验结果表明,该文提出的MSWE算法能够有效地从多源词语特征矩阵中学习到有效的特征因子,在6个词语相似度评测数据集上表现出了优异的性能。  相似文献   

6.
词语作为语言模型中的基本语义单元,在整个语义空间中与其上下文词语具有很强的关联性。同样,在语言模型中,通过上下文词可判断出当前词的含义。词表示学习是通过一类浅层的神经网络模型将词语和上下文词之间的关联关系映射到低维度的向量空间中。然而,现有的词表示学习方法往往仅考虑了词语与上下文词之间的结构关联,词语本身所蕴含的内在语义信息却被忽略。因此,该文提出了DEWE词表示学习算法,该算法可在词表示学习的过程中不仅考量词语与上下文之间的结构关联,同时也将词语本身的语义信息融入词表示学习模型,使得训练得到的词表示既有结构共性也有语义共性。实验结果表明,DEWE算法是一种切实可行的词表示学习方法,相较于该文使用的对比算法,DEWE在6类相似度评测数据集上具有优异的词表示学习性能。  相似文献   

7.
框架关系可以描述框架与框架之间的语义关系,通过对篇章构建框架关系图发现图中存在孤立框架,一个篇章表达的是一个语义整体,框架间关系缺失阻碍了篇章句子之间建立联系。针对该问题,进行面向篇章的框架关系预测方法研究,分别使用WSABIE算法、Word2vec方法和TransE方法训练得到框架表示作为关系预测的输入;使用余弦相似度方法和以Hing-loss函数为优化目标的神经网络方法进行实验,并在神经网络中融入框架本身的属性信息——框架定义。实验结果验证了基于知识图谱表示学习方法(TransE方法)的优越性以及框架定义信息的有效性,提升了框架关系预测的性能。  相似文献   

8.
问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务。该文提出了一种基于问题和答案联合表示学习的问题分类方法。该方法的特色在于利用问题及其答案作为共同的上下文环境,学习词的分布式表示,从而充分利用未标注样本中问题和答案隐含的分类信息。具体而言,首先,我们引入神经网络语言模型,利用问题与答案联合学习词向量表示,增加问题词向量的信息量;其次,加入大量未标注的问题与答案样本参与词向量学习,进一步增强问题词向量表示能力;最后,将已标注的问题样本以词向量形式表示作为训练样本,采用卷积神经网络建立问题分类模型。实验结果表明,该文提出的基于半监督问题分类方法能够充分利用词向量表示和大量未标注样本来提升性能,明显优于其他基准半监督分类方法。  相似文献   

9.
框架排歧指的是在一个给定的句子中,判断句中目标词激起的语义场景与该目标词可能激起的哪个框架一致,则将该框架分配给当前的目标词。框架排歧最重要的一个步骤就是特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验表明,不同的目标词取得最好的结果时所用的特征模板是不同的。因此,该文为每个目标词设置一个特征模板,并提出了特征模板的自动选择算法,首先从语料中抽取特征构成特征集,然后利用打分机制,把特征集中得分最高的特征逐个加入到特征模板中,直到相邻两次的得分不再增加。该文借助汉语框架网语义资源,利用最大熵模型建模,使用自动特征选择算法选出特征模板,并进行5-fold交叉验证,平均精确率可达到84.46%。  相似文献   

10.
词与其上下文的共现矩阵是词的分布表示学习的关键.在构造共现矩阵时,可采用不同方法来度量词与其上下文之间的关联.文中首先介绍了3种词与其上下文的关联度量方法并构造了相应的共现矩阵,使用同一个优化求解框架学习得到词的分布表示,在中文词语类比任务和语义相似性任务上的评价结果显示,GloVe方法的结果最好;然后进一步对GloVe方法进行了改进,通过引入一个超参数校正词与其上下文的共现次数,以使校正后的共现次数近似服从Zip'f分布,并给出了求解该超参数估计值的方法.基于改进后的方法学习得到的词的分布表示在词语类比任务上的准确率提高了0.67%,且在Mc-Nemar检验下是显著的;在词语相似性任务上的性能提高了5.6%.此外,将改进后的方法得到的词的分布表示应用到语义角色识别任务中,作为词特征的初始向量得到的F1值相比使用改进前的词的分布得到的F1值也提高了0.15%,且经3×2交叉验证的Bayes检验其提升也较为显著.  相似文献   

11.
基于帧差与非相邻帧差的自适应镜头检测方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对突变和渐变的特点,实现了一种基于帧差和非相邻帧差的自适应镜头检测方法。方法通过计算相邻帧差有效地检测突变镜头,通过计算非相邻帧差实现对渐变镜头的有效检测,二者结合可检测出几乎所有的突变和渐变镜头,获得了良好的综合检测效果。该方法不用设全局阈值,适应性强且计算量小,实验结果表明了方法的通用性和有效性。  相似文献   

12.
王明  肖熙 《计算机应用》2007,27(8):2051-2052
从变帧长、变帧率角度考虑提出一种新的提取MFCC的方法。该方法先将帧长和帧率都限制为基音周期的整数倍,即基音同步算法;然后基于变帧率算法的原理在语音特征变化缓慢的地方去除一些帧来降低帧率。在NIST 99说话人评测上进行的说话人确认实验表明,该方法不但提升了系统性能,而且降低了帧率,节省了特征文件的存储空间。  相似文献   

13.
基于边缘特征的单帧图像清晰度判定   总被引:1,自引:1,他引:1       下载免费PDF全文
自动调焦是保证目标跟踪系统实时获得清晰图像的重要技术,而何时触发调焦又成为了其中的关键问题。在图像清晰时如果触发调焦,初始的电机盲动会导致图像可能变得更模糊。提出了一种可单帧判断图像是否清晰的方法,消除了图像在清晰情况下却触发调焦的误操作,从而提高了跟踪的可靠性和精度。通过对多组实际图像序列的测试,证明该方法合理可靠。  相似文献   

14.
Digital ridgelet reconstruction based on local dual frame   总被引:1,自引:0,他引:1  
Candes and Donoho[1] introduced the concept of the ridgelet transform in 1998. Es- sentially, they applied the Radon transform to the original image, and then used the wavelet analysis in the Radon domain. Such system is very good at representing the smooth functions with line singularities. Thus it has great potentialities in the image compression, denoising, enhancement and other application cases. In the digital imple- mentation respect, Do[2] used the finite ridgelet transform to the ima…  相似文献   

15.
分析了LRC不同步的原因,通过对MP3帧结构的研究,提出了采用位率的计时方法。这种方法既实现了准确计时,又节省了系统资源,进而实现了LRC的精确同步。  相似文献   

16.
该文引入框架知识思想,对框架知识的构成过程进行了举例分析,并根据框架知识的构成、结构描述、内部组织、内部表示等,研究了藏文字框架知识表示的若干问题,构建了藏文字框架结构的描述以及藏文字框架系统。从而为进一步的藏语词汇、短语系列的框架知识的研究以及藏文字框架知识系统的实现奠定了基础。  相似文献   

17.
帧同步是OFDM的关键技术之一,传统的基于短训练符号周期帧同步算法互相关函数波动范围大。相关函数进行改进,利用互相关区间内所有信号的能量对相关函数进行归一化。通过改进互相关函数,明显减小了自相关函数的波动范围,且在高斯信道下,消除了帧检测方差的地板效应。然后利用接收符号和本地短训练符号的互相关性更准确地检测分组的到来。仿真结果显示,当指数衰减信道rms时延为50 ns以及低信噪比的情况下改进的算法SNR性能可提高4 dB左右。  相似文献   

18.
Category Partition Method (CPM) is a general approach to specification-based program testing, where test frame reduction and refinement are two important issues. Test frame reduction is necessary since too many test frames may be produced, and test frame refinement is important since during CPM testing new information about test frame generation may be achieved and considered incrementally. Besides the information provided by testers or users, implementation related knowledge offers alternative information for reducing and refining CPM test frames. This paper explores the idea by proposing a call patterns semantics based test frame updating method for Prolog programs, in which a call patterns analysis is used to collect information about the way in which procedures are used in a program. The updated test frames will be represented as constraints. The effect of our test frame updating is two-fold. On one hand, it removes “uncared” data from the original set of test frames; on the other hand, it refines the test frames to which we should pay more attention. The first effect makes the input domain on which a procedure must be tested a subset of the procedure’s input domain, and the latter makes testers stand more chance to find out the faults that are more likely to show their presence in the use of the program under consideration. Our test frame updating method preserves the effectiveness of CPM testing with respect to the detection of faults we care. The test case generation from the updated set of test frames is also discussed. In order to show the applicability of our method an approximation call patterns semantics is proposed, and the test frame updating on the semantics is illustrated by an example.
Lingzhong ZhaoEmail:
  相似文献   

19.
为解决已有的网络情报系统由于串行工作模式产生的效率和可靠性较低的问题,设计了一个分布式的网络对抗情报框架,框架使用统一的情报描述语言实现各情报子系统间的协同工作。使用Petri网仿真分析表明该框架具备良好的可靠性,真实环境下软件测试结果显示该框架对情报系统运行具有较好的效率支持,能够满足网络对抗的实际需要。  相似文献   

20.
帧速率上转换主要是用来实现两个不同帧率视频扫描格式之间的转换。它可以应用于HDTV和低比特码率编码等应用场合。将场景检测引入到帧率上转换方法中,根据视频内容的变化来检测场景的变换,然后自适应地选择内插(Interpolation)/外推(Extrapolation)的方法,从而解决了传统运动补偿内插法针对序列剧烈运动或场景切换难以处理的问题。同时,结合残差能量的大小和运动矢量的相关性对运动矢量的可靠性进行分类,对不可靠运动矢量采用可变块大小运动估计进行重新搜索,不断更新运动矢量,逐步消除由于运动矢量的不准确带来的方块效应和边缘模糊现象。实验结果表明,算法较传统的插值算法对内插图像的主观质量和客观质量都有所提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号