共查询到16条相似文献,搜索用时 46 毫秒
1.
2.
3.
4.
针对人机交互中最为常见的祈使句语句,结合汉语祈使句依存语法的特征,提出一种基于核心词语义的祈使句分类方法。它利用依存语法提取祈使句中具有语义特征的核心词,再利用Word2Vec将词分布式表示。用核心词的词向量计算该祈使句和类别之间的相似度,从而实现为祈使句分类。实验结果表明,利用依存语法的特征提取方法,结合将核心词组合表示为词向量后进行分类,在57个类别的分类结果中有92.64%的正确率。 相似文献
5.
6.
汉语组块分析研究综述 总被引:2,自引:0,他引:2
组块分析作为浅层句法分析的代表,既可以满足很多语言信息处理系统对于句法功能的需求,又可以作为子任务,在词法分析和完全句法分析以及语义分析中间架起一座桥梁,为句子进行进一步深入分析提供有力的支持,因此众多的研究将注意力集中于组块分析上。该文主要对组块的定义和分类、组块识别方法、组块的标注和评测以及组块内部关系分析等几方面的研究进展进行详细的综述。最后,探讨了组块分析存在的问题并对未来的发展方向进行了展望。 相似文献
7.
8.
9.
面向语料库标注的汉语依存体系的探讨 总被引:19,自引:9,他引:10
实现大规模真实文本的处理, 是信息化社会的迫切要求, 也是国际计算语言学界的一个战略目标目前一项迫在眉睫的任务是建立一套满足大规模真实文本处理的语言处理体系, 包括分词的标准、词的分类体系、句法体系和语义体系。其中句法体系是核心环节。本文提出并论证了依存语法是合乎大规模真实文本处理要求的句法体系, 并结合汉语的特点, 研究了汉语的依存语法, 划分了种依存关系。最后简要讨论了依存语法的一些应用 相似文献
10.
11.
12.
汉语中介语是伴随着汉语国际教育产生的,随着汉语学习在全球的不断开展,汉语中介语的规模不断增长,由于这些语料在语言使用上有其独特性,使得中介语成为语言信息处理和智能语言辅助学习的独特资源。依存语法分析是语言信息处理的重要步骤,英语中介语的依存语法标注语料已经有很好的应用,目前汉语中介语语料库对句法的关注度较低,缺乏一个充分考虑汉语中介语特点的依存句法标注规范。该文着眼于汉语中介语的依存句法标注语料库的建构,探讨依存标注规范,在充分借鉴国际通用依存标注体系(Universal Dependencies)的基础上,制定了汉语中介语的依存标注规范,并进行了标注实践,形成了一个包括汉语教学语法点的中介语依存语料库。 相似文献
13.
特征—观点对的抽取是观点挖掘中非常重要的研究课题之一。该文首先利用依存语法对句子进行了依存分析,在此基础上研究了旅游评论文本中特征-观点对的抽取。利用词对间的依存关系,构建了获取含有特征和观点词语的组块规则,并设计了候选特征的识别算法和特征—观点对的抽取算法。该文对山西旅游景点评论语料进行了实验,结果表明,特征—观点对的抽取整体的F1值达到了87.10%,验证了方法的有效性。 相似文献
14.
15.
谓词词库是深层语法模型分析和理解的核心资源。近年来的常规方法是人工构建或从标注语料库中自动获取,标注规模和信息容量的扩大受制于巨大的人工投入量和标注库体系设计。该文提出了一种多资源融合自动构建汉语谓词组合范畴语法(CCG)词库的新方法。从知网、北大语法信息词典和大规模事件句式实例中提取汉语谓词的不同句法语义分布特征,融合形成CCG原型范畴表示,将它们指派给各资源信息完全重合的谓词形成核心词库。然后通过自动分类和隶属度分析相结合方法对其他谓词的CCG范畴进行预测,并对两者结果进行融合得到扩展词库,最终合并形成包含约15,000个词条的汉语谓词CCG词库。通过在随机均匀抽样的1000个谓词上通过多人独立标注形成的标准测试库上进行不同角度的性能分析实验,表明该词库的预期准确率达到了96.3%。
相似文献
相似文献