共查询到11条相似文献,搜索用时 58 毫秒
1.
2.
一种启发式的汉语词性标注算法 总被引:1,自引:0,他引:1
描述了一种启发式的汉语词性标注算法,并采用该算法实现了一个基于统计模型的汉语词性标注系统。该算法将反向动态规划和正向A^*解码算法相结合。初步的开放测试表明,该系统的词性标注正确率为95.88%(小标记集)和97.95%(大标记集),性能优于Viterbi算法。 相似文献
3.
论述了一个多智能体并行设计环境中自然语言通信模块的设计和实现方法。通过建立一个受限词汇的综合信息库,记录词汇的各种语法、语义信息;采用扩充短语结构文法对句子结构进行分析,定义了句子生成模板,智能体借助该模板提供的接口函数生成自然语言句子。该设计方法建立在受限语言的基础上,突出了在协商式多智能体之间进行自然语言通信时的准确性。此外,为智能体提供了灵活、友善的接口,提高了多智能体并行设计环境的性能。 相似文献
4.
一种基于词矢量的汉语语义量化模型 总被引:6,自引:0,他引:6
通过建立基于词矢量的汉语语义量化模型来解决语义信息的自动获取及量化问题,描述了模型的建立方法及其在汉语词义排歧中的应用,最后通过构造伪词的方法对模型的语义辨识能力进行了评测。实验表明该语义量化模型具有很好的语义表示能力,并且由于模型的建立是通过对大规模生语料库的统计来完成的,避免了人工对词语语义进行量化时所需的庞大工作量,从而可以运用于许多与语义相关的自然语言处理任务中。 相似文献
5.
6.
7.
谓词词库是深层语法模型分析和理解的核心资源。近年来的常规方法是人工构建或从标注语料库中自动获取,标注规模和信息容量的扩大受制于巨大的人工投入量和标注库体系设计。该文提出了一种多资源融合自动构建汉语谓词组合范畴语法(CCG)词库的新方法。从知网、北大语法信息词典和大规模事件句式实例中提取汉语谓词的不同句法语义分布特征,融合形成CCG原型范畴表示,将它们指派给各资源信息完全重合的谓词形成核心词库。然后通过自动分类和隶属度分析相结合方法对其他谓词的CCG范畴进行预测,并对两者结果进行融合得到扩展词库,最终合并形成包含约15,000个词条的汉语谓词CCG词库。通过在随机均匀抽样的1000个谓词上通过多人独立标注形成的标准测试库上进行不同角度的性能分析实验,表明该词库的预期准确率达到了96.3%。
相似文献
相似文献
8.
对采用谓词执行优化技术后的编译代码,为了更高效地进行寄存器分配,首先介绍了Sias等人提出的一种基于二进制决策图(BDD)的谓词分析系统;然后在其基础上,对传统寄存器分配算法进行改进,给出了一种建立精化干涉图的新算法;最后将算法在学院研制的YHFT—DSP/700芯片的编译器上实现,实验结果表明,减少了所需寄存器数目,缩短了代码执行时间,获得了较好的性能提高. 相似文献
9.
汉语受限语言的设计与应用 总被引:4,自引:2,他引:4
在机器翻译和自然语言理解等领域内, 受限语言的研究是一项有意义的工作。本文在分析考查现代汉语岐义短语的基础上, 设计了一个汉语受限语言, 籍以对存在汉语中的岐义进行受限处理, 并且给出了一个应用实例——面向受限汉语的机器翻译前编辑系统。 相似文献
10.
本文提出了一种基于神经网络的汉语文法分析专家系统的设计方案。知识库采用产生式规则的知识表达方式,并将知识二元化存储在神经网络中。推理机采用神经网络进行推理。在论文的结尾给出了系统的运行实例,说明了该系统的有效性。 相似文献
11.
基于非监督训练的汉语词性标注的实验与分析 总被引:4,自引:0,他引:4
概率参数的获取是基于统计的词性标注的两个主要研究方向之一.侧重于研究非监督方式,利用未标注的语料进行训练获取概率参数.实现了一个非监督的训练标注模式-HMM-Basic;从不同的初始模型和训练集出发对汉语词性标注进行了实验;分析了训练集规模、初始模型的选择对系统标注性能的影响并讨论了其中所存在的问题。 相似文献