首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
自然语言处理是计算语言学研究的方向之一,通常借助计算机技术进行自然语言的分析和解读。NS 流程图具有选择算法剖析的结构性特点。良构子串表具有保存剖析过程多种结构的特性。花园幽径句是句法加工过程中能产生行进式错位且对前期模式破旧立新的特殊句式。基于NS 流程图算法的良构子串表可用于对自然语言中的特殊现象(如花园幽径句)进行程序剖析,最终使这种程序分析法在语言学中得到应用成为可能。  相似文献   

2.
该文以126名中国大学生为测试样本,并采用非独立t检验为计算方法,讨论英语花园幽径句解码效果与解码反应时之间的关联性。花园幽径句是能引发行进错位的局部歧义句,大学生在歧义消解过程中易产生认知困惑。在其他条件不变的情况下,先后两次的语言实验将单样本花园幽径句的反应时从5s延长至10s,并进行了相应的t值计算。S1实验中,测定5s反应时和10s反应时的非独立t检验值为3.71,大于理论临界值并具有显著性差异。在S2-S100的实验中,分析发现材料的选择对实验结果有影响。总体而言,英语花园幽径句解码效果与解码反应时之间具有一定关联性,阅读时间的延长可以在一定程度上帮助学生更好地消解局部歧义。  相似文献   

3.
花园幽径现象源自于认知语义短路,是语义流中途折返且另路通过的特殊语义排歧现象。花园幽径现象对先期理解产生行进式错位,是原有认知模式的否定之否定。基于程序设计的顺序、选择和循环结构可用于对花园幽径句进行算法剖析。以上下文无关语法(CFG)为主展开的句法解读,使花园幽径现象程序性在诸多特性中得到凸显。  相似文献   

4.
该文借助126名英语专业大二学生对100个花园幽径句和对照句的限时理解实验,讨论了中国英语学习者在解读花园幽径句过程中产生的错位效应,测算了效应强度,并与stanford parser的自动翻译进行了人机对比研究。花园幽径现象是一种有意识的受控行为。其编码和解码具有行进错位和认知过载现象,并能反映人类复杂的心理认知活动。实验证明: 在划分的引导词类错位、宾语辖域错位、嵌套错位和兼类错位四类中,错位效应呈现非对称性,其中兼类错位频数最高,错位效应强度也最大。在人机对照中,机器的程序解码错位和学习者认知解码错位不具有完全联动性和绝对共时性。  相似文献   

5.
车道被占用是当今社会中一个非常普遍的现象,会对道路的实际通行能力产生严重影响。其影响因素有车道宽度、路段通道数、交通管理等。该文着重分析了因事故车辆对不同行车道的占用、单向车道宽度、上游车流量、交叉口信号控制灯等因素对道路通行能力的影响,采用了停车线法对十字交叉口进行分析,构造函数模型求解不同占道情况下的通行能力。通过建立排队系统模拟仿真交通车辆排队,搭建模型模拟交通流动力特性。  相似文献   

6.
该文讨论了花园幽径现象(GPP)的数据结构。GPP数据结构呈现理解折返的认知树形结构,不同于语法前状态的词集合结构、句子理解的语法线性结构和语义匹配多对多的歧义图状结构。GPP结构的显著性特征如下:(1)GPP理解初期,数据结构呈线性特征;(2)GPP理解中期,语义触发点迫使原解码模式被推翻,数据结构表现为词集合结构;(3)GPP理解末期,行进式错位导致回溯形成,解码结构最终呈现树形结构;(4)GPP动态解码融合了除歧义图状结构之外的两种结构特征,语义触发语的激活产生额外认知负担。GPP树形结构与歧义图状结构的不同从数据结构角度证实了两种语法现象的迥异,从而为计算语言学解读GPP提供了理论支撑。  相似文献   

7.
在“现代汉语句法语义信息语料库”的基础上,我们将相对独立的句型系统、句模系统和句干系统有机整合在一起,建立了一个有层级体系的句系系统。并将[P]、[SP]、[SPO]、[PO]定义为基础句型,利用解析法,考察了基础句型对应的高频句模在复杂句模生成机制中的主体作用,此外还考察了补语、状语同语义成分的对应情况。通过寻求简单句型和复杂句型、简单句模和复杂句模之间的组合映射规律,从而找到句型句模对应机制研究的一个新的突破点。  相似文献   

8.
HNC作用效应句的汉英句类转换   总被引:1,自引:1,他引:0  
作用效应句是作用句的一个特殊子类,是HNC57组基本句类中一个极富个性的重要句类。从HNC概念网络的角度看,作用效应句主要由使役类动词和逼迫类动词直接形成,或者由一般作用类动词(含泛动类动词) 通过“得”字结构间接形成。由这三类动词形成的作用效应句遵循不同的句类转换和格式转换规则,因此在汉英机器翻译中,需要采取不同的句类转换框架,以确保译文语句句法语义结构的正确性。初步的试验表明,有关作用效应句的这些句类-格式转换规则具有很好的适用性和覆盖率。  相似文献   

9.
英汉机器翻译系统ECT中的知识库   总被引:1,自引:0,他引:1  
提出 E- Chunk概念 ,它是一种新的知识表示方式 .E- Chunk是无歧义翻译单元 ,形式上是一个无翻译歧义的单词或单词串 .它是基于语义定义的 ,具有无歧义性、复现性、可嵌套性、内部结构句法自足性等特征 .本文详细介绍了英汉机器翻译系统 ECT中的三类知识库 :电子词典、E- Chunk库和规则库  相似文献   

10.
复句关系类别的识别是对复句分句之间语义关系的甄别,是分析复句语义关系的关键。在现代汉语复句中,二句式和三句式复句占绝大多数,而三句式复句又可以拆分为二句式复句,所以多句式复句的研究归结起来就是二句式复句的研究。因此,本文以二句式非充盈态有标复句为研究对象,结合汉语复句的句法理论、关系标记搭配理论,以汉语复句语料库以及搜索引擎获取的复句为语料,进行二句式非充盈态有标复句关系类别的自动标识。使用本文提出的方法对二句式非充盈态有标复句关系类别进行自动识别,准确率达89%,实验结果证明了本文方法的有效性。  相似文献   

11.
泰文很少运用标点符号,句子间没有明显的分隔符,需要根据语义进行断句,为泰文词法分析、句法分析和机器翻译等自然语言处理任务带来了额外的困难。针对泰文断句问题提出一种基于Siamese循环神经网络的句子自动切分方法。相比传统泰文断句方法,该方法无需人工定义特征,而是采用统一的循环神经网络分别对候选断句点前后的词序列进行编码;然后,通过综合前后词序列的编码向量作为特征来构建泰文句子切分模型。在ORCHID泰文语料上的实验结果表明,所提出的方法优于传统泰文句子切分方法。  相似文献   

12.
多特征融合的语句相似度计算模型   总被引:1,自引:0,他引:1       下载免费PDF全文
句子的相似度计算在自然语言处理的各个领域都占有十分重要的地位。提出了一种多特征融合的句子相似度计算模型,该计算方法把句子的词形、词序、结构、长度、距离和语义这6种特征相似度考虑进来,通过对不同的特征赋予不同的权重来调节各个特征对于句子相似度的贡献,从而使计算结果得到最优。实验结果表明,该方法与其他方法相比,描述句子的信息更加全面,在计算句子相似度方面具有较高的准确率。  相似文献   

13.
针对处理高维度属性的大数据的属性约减方法进行了研究。发现属性选择和子空间学习是属性约简的两种常见方法,其中属性选择具有很好的解释性,子空间学习的分类效果优于属性选择。而往往这两种方法是各自独立进行应用。为此,提出了综合这两种属性约简方法,设计出新的属性选择方法。即利用子空间学习的两种技术(即线性判别分析(LDA)和局部保持投影(LPP)),考虑数据的全局特性和局部特性,同时设置稀疏正则化因子实现属性选择。基于分类准确率、方差和变异系数等评价指标的实验结果比较,表明该算法相比其它对比算法,能更有效的选取判别属性,并能取得很好的分类效果。  相似文献   

14.
面向对象有标复句本体建模*   总被引:4,自引:1,他引:3  
基于面向对象方法为带标志构件的现代汉语复句子类(有标复句)建立本体模型,奠定中文信息处理复句层级的研究基础。在原有成果的基础上,利用关系标志与分句间的联系对标志构件进行句法分析,并在本体构造方法框架的指导下,用UML语言构造有标复句领域相关概念的本体模型。与已有成果相比,改进的模型能更精确、更深入地描写有标复句的特征。  相似文献   

15.
Sentence alignment is a basic task in natural lan-guage processing which aims to extract high-quality paral-lel sentences automatically.Motivated by the observation that aligned sentence pairs contain a larger number of aligned words than unaligned ones,we treat word translation as one of the most useful external knowledge.In this paper,we show how to explicitly integrate word translation into neural sentence alignment.Specifically,this paper proposes three cross-lingual encoders to incorporate word translation:1)Mixed Encoder that learns words and their translation annotation vectors over sequences where words and their translations are mixed alterma-tively;2)Factored Encoder that views word translations as fea-tures and encodes words and their translations by concatenating their embeddings;and 3)Gated Encoder that uses gate mechanism to selectively control the amount of word translations moving forward.Experimentation on NIST MT and Opensub-titles Chinese-English datasets on both non-monotonicity and monotonicity scenarios demonstrates that all the proposed encoders significantly improve sentence alignment performance.  相似文献   

16.
张璞  刘畅  李逍 《计算机应用》2019,39(3):639-643
建议挖掘作为一项新兴研究任务,具有重要的应用价值。针对传统建议语句分类方法所存在的规则复杂、标注工作量大、特征维度高、数据稀疏等问题,提出一种基于PU学习的建议语句分类方法。首先,使用简单规则从无标注评论集合中选择建议语句的正例集合;然后,为了降低特征维度,缓解数据稀疏性,在自编码神经网络(Autoencoder)特征空间中使用Spy技术划分可靠反例集合;最后,利用正例集合和可靠反例集合来训练多层感知机(MLP)对剩余的无标注样例进行分类。该方法在中文数据集上的F1值和准确率值分别达到81.98%和82.67%,实验结果表明,该方法能够有效地对建议语句进行分类,且不需要对数据进行人工标注。  相似文献   

17.
句群是介于句子和段落之间的一个处理单位。在语言概念空间句群有三个要素:领域、情景和背景,领域是最根本的。获取了句群领域,就能够确定情景框架,这对信息抽取和文本分类都是非常重要的。一些词语的概念符号中蕴含了领域信息,通过分析词语在句子中的语义角色以及词语位置、频次等可以得到句子的领域。根据领域关系可以合并领域相同或相似的句子,得到句群及其领域。实验表明,常见的四种领域关系能够很好地被处理,但在动态词处理、复合领域的识别等方面还需要改进。  相似文献   

18.
Computational neuroscience studies have examined the human visual system through functional magnetic resonance imaging (fMRI) and identified a model where the mammalian brain pursues two independent pathways for recognizing biological movement tasks. On the one hand, the dorsal stream analyzes the motion information by applying optical flow, which considers the fast features. On the other hand, the ventral stream analyzes the form information with slow features. The proposed approach suggests that the motion perception of the human visual system comprises fast and slow feature interactions to identify biological movements. The form features in the visual system follow the application of the active basis model (ABM) with incremental slow feature analysis (IncSFA). Episodic observation is required to extract the slowest features, whereas the fast features update the processing of motion information in every frame. Applying IncSFA provides an opportunity to abstract human actions and use action prototypes. However, the fast features are obtained from the optical flow division, which gives an opportunity to interact with the system as the final recognition is performed through a combination of the optical flow and ABM-IncSFA information and through the application of kernel extreme learning machine. Applying IncSFA into the ventral stream and involving slow and fast features in the recognition mechanism are the major contributions of this research. The two human action datasets for benchmarking (KTH and Weizmann) and the results highlight the promising performance of this approach in model modification.  相似文献   

19.
Conclusion Our principle intention has been to show how a general-purpose pattern-matching procedure can serve as the basis for a simple automated system for the grammatical analysis of sentences produced by students. From a pedagogical point of view, the design of instructional modules in terms of simple phrase-structure grammars appears to be feasible and general, at least for elementary topics in grammar and usage. A virtue of the system is that it requires the student to perform a task which is very much like that for which he is being trained, i.e., the creation of grammatical and at least minimally effective sentences. It also provides rapid feedback. An efficient large-scale system for processing student interaction with modules which are restricted to fairly simple grammars would be adequate for a considerable body of instructional material. We are pleased to acknowledge the assistance of Ms. Gay Brookes who designed a number of lessons and participated in the early use of the system, and of Mr. David Barach who designed and programmed the PDP-8 grammatical analyzer. The project was initially supported by a grant from the Board of Higher Education University Program through the auspices of the Office of the University Dean for Community College Affairs.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号