排序方式: 共有14条查询结果,搜索用时 15 毫秒
1.
该文以现代汉语中的“A+一+X,B+一+Y”格式为例,介绍了构建《现代汉语构式知识库》的初步工作。“A+一+X,B+一+Y”格式可根据其表义功能不同分为三个大类,十个小类。该文重点阐释了该构式表达“因果倚变义、事物交错义、状态交替义、动作行为交替义、周遍大量义、让步小量义”等6种意义的判定条件及相应的释义模板。 相似文献
2.
该文以现代汉语(特别是网络搜索词)中的名名组合为主要研究对象,探索一种基于规则的汉语名名组合的自动释义方法。其研究步骤为: (1)利用《现代汉语语义词典》中名词的语义类别,来建立名名组合的语义类组合模式;(2)在“生成词库论”中物性角色思想的指导下,用名名组合中某个名词的施成角色或功能角色作为释义动词,来揭示这两个名词之间的语义关系;(3)以语义类组合模式为单位构建名名组合的释义模板,并汇集成名名搭配数据库;(4)利用《知网》资源,来获取具体名词的施成角色和功能角色,建立汉语名词知识库。在这两个数据库的基础上,我们初步实现了一个汉语名名组合的自动释义程序。 相似文献
3.
4.
秦其良 《重庆理工大学学报(自然科学版)》2005,19(12):143-146
“做”与“作”二字在使用中经常出现混淆现象,举出部分字典、词典中“做”与“作”二字的释义,并进行比较分析,阐述了造成二字混用的原因,提出了解决混用的几点看法。 相似文献
5.
该文针对藏文语料稀缺的问题,在藏汉双语、藏文单语文本改写检测任务中使用数据增强的方法,在一定程度上解决了低资源语言训练语料规模小的问题。在藏汉跨语言文本改写检测任务中,该文使用数据增强方法,有效利用目前公开的藏汉平行语料,扩充藏汉跨语言文本改写检测训练语料,当扩充至20万句对时,藏汉改写检测模型的皮尔森系数(pearson correlation)达到0.547 6,比基线系统的皮尔森系数提升了0.397 1,表明藏汉改写检测模型检测出的句对相似度值与人工标注的相似度值已达到中等程度相关。在藏文单语言任务中,该文采用训练藏文音节向量的方法,以缓解语料稀缺带来的词向量稀疏问题。实验结果表明,基于藏文音节向量的藏文改写检测模型的皮尔森系数可达到0.678 0,比相应的基于藏文词向量实验的结果提升了0.1,使得藏文单语言文本改写检测模型的检测结果与人工标注的结果达到了强相关程度。 相似文献
6.
7.
8.
开放域上基于深度语义计算的复述模板获取方法 总被引:1,自引:0,他引:1
利用实体关系从网络大规模单语语料获取复述模板的方法可以规避对单语平行语料或可比语料的依赖,但是后期需要人工对有语义差异的关系模板分类后获取复述模板。针对这一遗留问题,该文提出基于深度语义计算的复述模板自动获取方法,首先设计基于统计特征的模板裁剪方法,从非复述语料中获取高质量的关系模板,然后设计基于深度语义计算的关系模板聚类方法获取高精度的复述模板。我们在四类实体关系数据上的实验结果表明,该方法实现了关系模板的自动获取与自动聚类,可以获得语义相近度更高、表现形式多样的复述模板。 相似文献
9.
10.
探究复述策略对获取实体属性槽“源信息”的意义 总被引:1,自引:0,他引:1
实体属性槽填充是一种抽取命名实体特定属性(slot)实例(也称槽值,即filler)的自然语言处理研究。其中,“源信息”特指属性实例的来源,即一段或一句佐证实例正确反映属性的文本片断。观测语料可以发现,实体属性源信息中存在大量同质异构现象,即复述现象。因此,该文结合复述技术与现有知识库,探究了复述识别模型在仅有小规模种子“源信息”的基础上,对于实体属性槽源信息分类的有效性。实验证明,基于树编辑模型的复述识别方法在先验知识较少的情况下,能够很好地捕获实体属性的相关“源信息”。 相似文献