共查询到20条相似文献,搜索用时 46 毫秒
1.
CEMT—Ⅲ系统中汉语兼类问题的处理 总被引:2,自引:0,他引:2
汉语中词的兼类是一个普遍存在的现象。任何工程化的汉语句法分析系统都不能回避这个重要而难以解决的歧义问题。本文根据汉英机器翻译系统CEMT-III的有2万词条的机器词典进行了统计, 其中兼类词占7.7%, CEMT-III系统采用多级渐进处理策略, 将确定性推理和非确定性推理相结合, 实现了汉语词的兼类自动消除机制。 相似文献
2.
汉语词性标注方法的研究 总被引:4,自引:0,他引:4
1 引言自然语言中,表达意义的符号(词)往往在各个层面上有歧义。在句法层面上,一个词可以兼好几种词性;在语义层面上,一个词可能有多个义项。词性歧义是由语言中的兼类词,即具有不止一个词性特征的词所引起的,只有在一定的上下文语境关系中,词所表现 相似文献
3.
4.
基于统计方法的汉语自动文摘系统研究 总被引:11,自引:0,他引:11
本文简要介绍了文本的向量空间模型表示,并提出了用该模型进行非受限真实文本的自动文摘方法。其基本思想是对输入文本进行项(本文为词和概念)的统计,根据不同项在文本中的分布评估其重要性,据此和其它信息形成句子的综合权重,生成摘要。文中较详细地介绍了系统的实现及实验结果,同时提出了对文摘系统的评价方法。 相似文献
5.
6.
7.
文章提出了基于RoughSets的汉语兼类词初始标注规则的获取方法,并通过模糊神经网络(FNN)进行优化,最后再进行简化获取模糊规则;文章以人工标注过的句子作为训练集和测试集,得出了训练集左3、左4、右3、右4个兼类词标注规则库;对同样的训练集和测试集,采用统计二元模型进行标注后,再利用该方法(粗糙模糊神经网络方法,简称RSFNN)进行二次标注,结果表明RSFNN方法优于统计二元模型方法。最后实例说明汉语兼类词词性标注规则的获取方法。 相似文献
8.
9.
本文在分析了现有切词方法和汉语特点的基础上,提出一各上具有多知识支持的分词方法SSK。SSK方法采用一种分层结构的词典,使每个词在匹配过程中能自动生成 其所有可能的重切,使切词失败时的歧义处理变得十分简单、有效。SSK方法不但得到字、词层次上知识的支持,肯得到语法、语义知识的支持。该方法通过语法、语义检查可及时晚报除一些切分错误,减少了歧义切分,且SSK方法具有简单的词汇学习功能,提高了切词正确率。 相似文献
10.
在汉语的自然语言处理领域中,汉语的语义标注一直是一个重要的研究课题。在以往的研究中,大多使用手工的方式取得模板进行标注;采用抽取自动模板的方法,对汉语的语义进行标注,以解决对词的类别进行标注,以及对复合结构语义关系进行标注的问题。实验效果表明,对词的类别进行标注取得了在把维度降到363时的精确率为81.6406%的结果;对复合结构语义关系之间的标注也取得了比以往工作有所改进的成果。 相似文献
11.
基于义原同现频率的汉语词义排歧方法 总被引:19,自引:0,他引:19
词义排岐是自然语言处理的重点和难点问题之一。基于语料库的统计方法已被广泛地应用于词义排岐,大多数的统计方法都受到数据稀疏的困扰,对于词义排岐而言,由于有大量同义词的存在,数据稀疏问题变得更为严重。充分利用“知网”这个知识源的特性,提出了一种基于义原同现频率的同义排岐方法,在很大程度上克服了数据稀疏问题。此外,该方法还避免了繁重的人工标注语料的过程,通过在一个约10万字的语料库上获得义原同现频率矩阵,并以此作为词义排岐的依据,实验表明,该方法对词义排岐具有较高的正确率。 相似文献
12.
结合句法组成模板识别汉语基本名词短语的概率模型 总被引:5,自引:0,他引:5
文中首先给出了汉语基本名词短语的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性,文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题。据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N元模型结合起来,形成了汉语baseNP识别的新模型。实验证明,该模型的性能优于 相似文献
13.
讨论建筑规划设计中的最大容积率估算问题.对问题进行适当的简化,建立了最大容积率的数学规划模型.提出了使用Hopfield网络求解这个大规模数学规划问题的有效方法,完整地解决了最大容积率的估算问题. 相似文献
14.
混沌神经网络研究进展与展望 总被引:28,自引:0,他引:28
概述了混沌动力学的特性,回顾了近年来混沌神经元主混沌神经网络的研究进展,在此基础上,介绍了两种混沌神经网络模型,分析了其构成和特点,已有研究结果表明,混沌神经网络在联想记忆和组合优化等方面有现有网络更好的性能,最后,指出了混沌神经网络的应用与研究方向。 相似文献
15.
模糊细胞神经网络在书法碑帖汉字重构中的应用 总被引:2,自引:0,他引:2
模糊细胞神经网络作为一种模拟逻辑可编程并行网络,可以用来实时实现数学形态学的全部基本算子。文中基于加性模糊细胞神经网络结构,应用数学形态学的重构算法,研究中国书法碑帖在自然腐蚀噪声环境下的去噪和汉字提取问题,并给出了算法的伪代码描述和数字计算信息结果。该方法可应用于书法碑帖的汉字处理和实时重构。 相似文献
16.
计算机汉语文稿校对系统 总被引:5,自引:0,他引:5
本文对汉语文稿中常出现的错误进行了分析,给出了错误规律的一菜式化表示,并阐述了识别方法和校正方法,最后讨论了汉语文稿校对系统的初步实现。 相似文献
17.
二维局域连接神经网络 总被引:1,自引:0,他引:1
本文提出了一种具有局域连接特性的二维神经网络模型,有效地克服了Hopfield种经网络因完全连接而带来的若干缺陷,并给出了相应的学习算法及用此神经网络记忆和识别26个英文字符的模拟结果. 相似文献
18.
19.
本文论述了前馈型网络,隐节点层进行线性独立变换的能力.严格证明了Mirchandani等关于隐节点在输入空间划分出区域数的定理.给出多层前馈型神经网络采用单位阶跃和连续渐近激发函数两种情况下,实数值样本绝对记忆能力的两个定理. 相似文献
20.
关于神经网络的能量函数 总被引:5,自引:0,他引:5
能量函数在神经网络的研究中有着非常重要的作用,人们普遍认为:只要能量函数沿着网络的解是下降的,能量函数的导数为零的点是网络的平衡态,能量函数有下界,则网络是稳定的且网络的平衡态是能量函数的极小点,文中取反例说明上述条件下不能保证网络的稳定性,并取例说明即使网络稳定也不能保证网络的平衡态与能量函数的极小点,证明了在网络具有上述条件的能量函数的情况下网络稳定的充分必要条件是网络的解有界,讨论了网络的平 相似文献