首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于最大熵模型的语义角色标注   总被引:1,自引:0,他引:1  
提出了基于最大熵模型的语义角色标注方法,该方法以浅层句法分析为基础,把短语或命名实体作为标注的基本单元,将最大熵模型用于句子中谓词的语义角色标注.该方法的关键在于模型参数估计和特征选择.具体应用中采用IIS算法学习模型参数,并选择基于句法成分的、基于谓词的、句法成分一谓词关系、语义四类特征作为模型特征集.将该方法用于信息抽取中事件表述语句的语义角色标注,对"职务变动"和"会见"两类事件的表述语句进行事件要素的语义角色标注,在各自的测试集上分别获得了76.3%和72.2%的综合指标F值.  相似文献   

2.
袁里驰 《电子学报》2013,41(10):2029
目前主流的词汇化句法分析方法仅仅考虑词语之间的语义依存关系,而没有引入语义搭配和语义类等语义信息.“配价”是词语的一个比较本质的特点,一旦一个词语的配价结构确定下来,它应该和怎样的词进行搭配也就比较清楚了,从而也可以比较直接地导出句子的结构.本文结合中心词驱动句法分析模型,提出了基于配价结构和语义依存关系的句法分析模型.模型在规则的分解及概率计算中引入丰富的语义信息,既包括语义依存信息,也包括配价结构等语义搭配信息.用改进的句法分析模型进行句法分析实验,实验结果表明,精确率和召回率分别为88.76%和87.43%,综合指标F值比Collins的中心词驱动句法分析模型提高了6.65个百分点.  相似文献   

3.
汉语框架网络包含丰富的本体语义信息。利用词汇的语义信息来探测框架在本体体系中的关系,利用自主学习技术确定相应本体,完善汉语框架网络本体的配价模式。实验证明,本体学习策略的选取对于本体的构建及语义检索性能的提高,发挥了重要作用。  相似文献   

4.
沈立  王志英  鲁建壮 《电子学报》2004,32(2):191-195
谓词执行技术能够将多个基本块合并为一个超块,扩大指令调度范围,开发更多的指令级并行.但它也给编译优化带来一些新问题,使得传统的编译器在进行指令调度或寄存器分配等优化工作时往往只能得到保守的结果.受所用谓词表示方法的限制,目前的谓词关系分析方法必须首先重构控制流信息,这就影响了编译优化的效果和效率.本文提出了一种基于路径编码的谓词表示方法,将谓词定义信息转换为等价的域编码,并以此为基础实现了一个全局谓词关系分析子系统.模拟结果表明,该子系统能够准确高效地实现全局谓词关系分析,在保证编译效率的同时,提高了编译优化的效果.  相似文献   

5.
利用语义角色分析的方法对动态新闻进行事件抽取研究。通过对句子进行论元结构标注,抽取出句子中以谓语动词为中心的论元结构,将其转化为具体的语义角色,并与事件要素进行匹配,完成事件抽取工作。论文提出并重点研究了如何利用VerbNet和SemLink资源对动词的论元结构与事件要素进行匹配。抽取系统基于该方法对1 000篇新闻语料进行了事件抽取实验,结果表明该方法的F值达到70.6%,具有一定的应用价值。  相似文献   

6.
基于互补谓词的编译优化   总被引:1,自引:0,他引:1       下载免费PDF全文
许多通用和嵌入式高性能处理器都支持谓词执行,利用谓词执行可以简化程序的控制结构,而且指令调度、寄存器分配也可以利用谓词提高效率.基于二进制决策图(BDD)的谓词分析系统,提出了一种利用互补谓词机制对控制结构进行优化的方法;对传统着色图寄存器分配算法进行改进,给出了一种利用互补谓词机制建立统一简化干涉图的新算法,减少了代码溢出;利用互补谓词的特性指导指令调度,使之更加有效利用资源,并对目标体系结构进行了改进以支持指令调度.最后在YHFT-DSP/700芯片的编译器上对所提优化方法的有效性进行了验证.  相似文献   

7.
GCC基于IA-64谓词执行的IF转换技术研究   总被引:1,自引:0,他引:1  
编译器在提高程序运行速度和发挥处理器性能方面起着非常关键的作用,尤其在IA-64体系结构中,其性能的发挥在很大程序上依赖于相应的编译器.IF转换利用IA-64对谓词执行的支持,删除程序中的某些控制流,将控制依赖转换为数据依赖,以便于优化.文章介绍了IA-64体系结构,并详细分析了GCC中基于IA-64谓词执行的IF转换算法.  相似文献   

8.
在小语种舆情监控领域,由于小语种的标注语料难以获取,导致深度学习的训练效果较差.对于民间及媒体发表的新闻内容很难准确抽取其核心观点句,从而影响了进一步的舆情分析效果.为了将研究问题具体化,以越南语为例,提出一种融入共享主题特征的汉越跨语言新闻观点句的抽取方法,可以借助充足的汉语标注语料解决小语种资源稀缺问题,并利用双语可比语料间可共享的主题信息来优化抽取效果,进而提升舆情监控效果.具体方法为,提取汉越可比新闻的隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题来构建共享主题特征,借助共享主题词典和情感词典训练双语词嵌入模型来共享汉越语义空间表征,将特征融入词向量,通过将语义信息与主题、情感、位置信息相结合来提升抽取效果.在汉越可比新闻数据集里进行的实验结果表明,融入共享主题特征能够提升小语种新闻观点句的抽取效果,F1值达到0.721,对小语种舆情监控起到支撑作用.  相似文献   

9.
为提高自动发音错误检测性能,提出一种区分性特征补偿训练算法.该方法将高斯后验概率矢量经过线性变换后作为偏移量补偿至传统的谱特征.将经过正确度标注的语音数据库上的发音错误检测F1值的最大化作为变换参数的训练准则.推导了目标函数对变换参数的偏导数公式,并利用无约束参数优化例程L-BFGS更新变换参数.发音错误检测实验表明该方法能够有效增大训练和测试集的F1值.并且训练和测试集的精确度、召回率也都有明显提高.在特征优化的基础上进行模型参数训练,检错性能较单独的区分性特征训练、单独的区分性模型训练都有进一步改进.  相似文献   

10.
凌广明  徐爱萍  王伟 《电子学报》2000,48(11):2081-2091
文本序列的自动标注能够解决深度学习普遍面临的人工标注成本过高的问题.本文针对地址信息的实体表述特征,构建基于实体边界矩阵(Entity Boundary Matrix,EBM)的表示模型,在此基础上提出了一种基于深度学习和KNN标签修正算法(K-Nearest Neighbours Correction Algorithm,KNN-CA)的不需要任何人工标注训练集的自动标注算法.首先获取预置小区数据集并构建离线特征库和初始化在线特征库;接着通过匹配算法求解EBM并利用KNN-CA进行优化,再通过数据增广得到自动标注的训练集;然后训练BiLSTM-CRF深度学习模型并预测所有未曾标注的地址信息的序列标注;最后再次利用KNN-CA优化可求解EBM的序列标注,由此构建适用于中文地理命名实体(Chinese Geospatial Named Entities,CGSNE)识别及相关研究的序列标注语料库.实验表明,标注数据的F1值达到了95.35%.  相似文献   

11.
Semantic role labeling (SRL) is a task in natural‐language processing with the aim of detecting predicates in the text, choosing their correct senses, identifying their associated arguments, and predicting the semantic roles of the arguments. Developing a high‐performance SRL system for a domain requires manually annotated training data of large size in the same domain. However, such SRL training data of sufficient size is available only for a few domains. Constructing SRL training data for a new domain is very expensive. Therefore, domain adaptation in SRL can be regarded as an important problem. In this paper, we show that domain adaptation for SRL systems can achieve state‐of‐the‐art performance when based on structural learning and exploiting a prior model approach. We provide experimental results with three different target domains showing that our method is effective even if training data of small size is available for the target domains. According to experimentations, our proposed method outperforms those of other research works by about 2% to 5% in F‐score.  相似文献   

12.
尤涛  杨凯  杜承烈  钟冬  朱怡安 《电子学报》2015,43(2):358-364
当前的事件匹配算法不能在高效匹配的同时满足频繁订阅变更的要求.在结合已有谓词索引算法和覆盖网络算法的基础上,融合谓词索引结构的易变更和覆盖网络的高效匹配特点,提出一种混合的事件匹配算法.算法将部分订阅覆盖关系从覆盖网络中剥离,以同谓偏序的形式引入到谓词索引结构中去,达到高效匹配的同时保留了谓词索引的易变更结构.实验表明,与同类算法相比该算法能够在频繁订阅情况下提供高效的匹配,从而满足相关应用的需求.  相似文献   

13.
针对正交频分复用(OFDM)系统,提出了一种低复杂度、高性能的载波频偏盲估计 方法。该方法充分利用载波频偏估计代价函数在一定区间内的单谷特性,采用黄金分割法搜 索载波频偏估计代价函数极值,从而大大降低其计算复杂度。最后对该方法和Tureli′s MU SIC-like(TML)载波频偏估计方法在加性高斯白噪声信道和多径信道环境下进行了仿真,结 果表明, 在同等条件下该方法的计算复杂度大大低于TML载波频偏估计方法。  相似文献   

14.
孙晓 《中国通信》2012,9(3):124-133
Discriminative Latent Model (DLM) is proposed for Multiword Expressions (MWEs) extraction in Chinese text to improve the performance of Machine Translation (MT) system such as Template Based MT (TBMT). For MT systems to become of further practical use, they need to be enhanced with MWEs processing capability. As our study towards this goal, we propose DLM, which is developed for sequence labeling task including hidden structures, to extract MWEs for MT systems. DLM combines the advantages of existing discriminative models, which can learn hidden structures in sequence labeling task. In our evaluations, DLM achieves precisions ranging up to 90.73% for some type of MWEs, which is higher than state-of-the-art discriminative models. Such results demonstrate that it is feasible to automatically identify many Chinese MWEs using our DLM tool. With MWEs processing model, BLEU score of MT system has also been increased by up to 0.3 in close test.  相似文献   

15.
王健  陈舒涵  徐秀奇  王奔  胡学龙 《信号处理》2020,36(9):1503-1510
阴影检测向来是计算机视觉领域的一个基础性挑战。它需要网络理解图像的全局语义和局部细节信息。本文提出了一种检测阴影区域的先验特征金字塔网络结构。该网络搭建了先验加权模块来提取图像中蕴含的阴影先验信息,通过使用阴影先验信息加权卷积特征,引导网络学习到阴影区域。同时,该网络还应用了特征融合模块来融合粗略的语义信息和自上而下路径中的精细特征,并且加入了后处理,进一步优化网络的预测结果。本文在两个公开的阴影检测基准数据集上进行了实验来评估其网络性能。实验表明,本文的方法能够更准确地检测到阴影,和过去最先进的方法相比也表现出色,在SBU数据集上正确率达到了96.6%,平衡检测错误因子为6.22。   相似文献   

16.
本文介绍了对西文Prolog的系统谓词和工具库谓词的修改和扩充算法,使修改后的西文Prolog2.0和工具库完全适合开发在汉化的Dbase信息管理系统上建立中文专家系统。  相似文献   

17.
针对红外图像的车辆检测,结合梯度方向直方图(HOG)特征与监督保局投影(SLPP),提出单帧图像车辆检测算法。首先,为增强特征描述能力、提高检测性能,在不增加特征维数的情况下,利用图像分割将区域的轮廓信息、灰度信息融入HOG特征中;其次,针对传统HOG特征维度过高,影响车辆检测效率以及准确率的问题,采用SLPP对提取的SHOG特征进行降维;最后,利用极限学习机(ELM)对样本图像的低维特征进行训练得到ELM分类器,实现车辆检测。本文以实拍红外图像作为实验数据,实验结果显示:针对红外图像的车辆检测,本文算法的检测性能较好,与原始HOG特征相比,本文所提SLPP-SHOG特征的特征维数由1764降至30,检测准确率升高16.03%,F1-measure提高了8.79%,检测时间由5.7 ms降至2.6 ms。  相似文献   

18.
We establish that the feedback capacity of the trapdoor channel is the logarithm of the golden ratio and provide a simple communication scheme that achieves capacity. As part of the analysis, we formulate a class of dynamic programs that characterize capacities of unifilar finite-state channels. The trapdoor channel is an instance that admits a simple closed-form solution.  相似文献   

19.
针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了 一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干 网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息; 其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大 小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果。实验结果 表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、 77.0%和81.3%,相比其他基于分割的算法,该算 法对弯曲文本的检测效果良好,具有一定的 应用价值。  相似文献   

20.
Automatic fuzzy ontology generation for semantic help-desk support   总被引:1,自引:0,他引:1  
Customer service support is an important operation for most multinational manufacturing companies. With the advancement of internet technologies, customer services nowadays are supported through web-based systems. More recently, rapid development of the semantic web and semantic web services has prompted us to develop a semantic help-desk for supporting customer services over the semantic web environment, which is presented in this paper. In particular, a fuzzy formal concept analysis (FCA)-based approach is developed for automatic generation of fuzzy machine service ontology that can deal with uncertain information. The proposed automatic fuzzy ontology generation technique consists of the following steps: fuzzy formal concept analysis, fuzzy conceptual clustering, and ontology generation. As such, the supporting machine services provided by the proposed system will potentially improve customer satisfaction in terms of reducing machine down time and increasing productivity. In this paper, an experiment has also been conducted for performance evaluation. The experimental result shows that the proposed approach has attained good performance in terms of both accuracy and efficiency when the queries are associated with appropriate membership values, and a suitable confident threshold is set.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号