首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
正确区分词与非词 ,是词典标注词性的必要前提 ;坚持科学地给词归类 ,是词典标注词性的重要原则 ;逐词逐项标注词性 ,是词典标准词性的基本方法。  相似文献   

2.
首先介绍文献术语的重要性和分布情况,归纳常用的文献术语抽取方法,进而提出一种从英汉平行语料库中自动抽取术语的算法.主要采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐,并对英文语料和中文语料分别进行词性标注.统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集.然后对每个英文候选术语计算与其相关的中文翻...  相似文献   

3.
词性标注规则的获取和优化   总被引:6,自引:0,他引:6  
本文提出一种词性标注规则自动学习算法。通过对规则进行评价、优化,有效提高标注正确率和标注效率。系统对PFR标注语料库进行标注,相对于NA假设的词性兼类消歧模型标注结果,封闭测试正确率提高了5.53%,开放测试提高了4.57%。  相似文献   

4.
词性标注作为汉语自动分词以至中文信息处理领域比较关键的问题之一,是该领域的研究难点也是研究重点,对兼类词词性标注的正确率严重影响着词性标注的质量。在基于规则的词性标注的基础上,提出了一种基于规则优先级的词性标注方法,即对每条词性标注规则加上优先级,并在标注算法中通过对优先级进行控制来完成兼类词的词性标注。并用大规模语料对该方法做了试验,结果表明其词性标注正确率可达到96.4%。  相似文献   

5.
本文试图比较汉化的科学术语和英语科学术语的差异,分析两种语言系统对同一事物的认识特点,并且希望从中预见语言引入后,引入地语言可能会发生的变化。  相似文献   

6.
基于组块及记忆的模型(BMM)采用与传统方法明显不同的标注思路,以汉语中的整句为处理单元,从组块出发,立足于单个词汇,分析更为丰富的上下文语境知识,并借助知网词典记忆词性集合,同时采用渐增式的机械学习方式获取参数值。对于棘手的稀疏数据问题只简单地设置平伏常数加以平滑,最后利用少量人工规则修正标注结果。实验表明,该模型的封闭式测试准确率将近99%,开放式测试准确率为95%以上。  相似文献   

7.
提出了一种基于词向量的两层词性标注方法,使用少量人工提取的特征,大部分特征可使用词向量和第1层标注向量自动训练得到.该方法将标注集分成两类,分别作为不同层的标注集.首先,对容易标注的类别进行标注;然后,对难以标注的动词或者名词进行第2层标注,将其标注为具体的某类动词或名词.利用该方法对中国学生写的英语文章进行词性标注的准确率可从95.23%提高到95.63%,超过了现有基于词向量词性标注器对相同语料词性标注的准确率.  相似文献   

8.
面向英语文章的词性标注是对英语文章实现自动批改的基础,虽然研究者对英语词性标注做了大量有益的研究,但是大多数的研究都面向英语为第一语言的用户,而面向英语为第二语言用户的相关研究则很少. 为此,对以英语为第二语言用户的英语文章进行了人工标注,在此基础上提出了一种面向英语文章的词性标注算法,融合了词聚类、无标语料统计信息、单词发音等特征. 实验结果表明,该算法能有效提高词性标注性能,标注正确率从94.49%可提高到97.07%.  相似文献   

9.
文章首先回顾了国内诸研究工作者对科技术语的特征所做的研究及其所做的描述;文章认为名词性术语可分为两大类,即某个单独的名词可以表示一个事物或概念,某两个或两个以上的合成名词也可以表示一个事物或概念;最后讨论了科技术语的精确翻译。文章认为要精确翻译科技术语,既要注意早已约定俗成为大家所接受的译名,又要对新涌现的科技术语反复斟酌译名,并保持科学严谨的工作态度。  相似文献   

10.
11.
随着社会经济快速发展和供电企业客户数量的不断增长,客户对供电企业的服务要求也越来越高。计算机网络和通讯技术的快速发展与不断完善,为提供优质服务提供了基础。本文提出了应用无线POS联网实时收费系统解决客户缴费难问题,并对无线POS联网实时收费系统的系统架构、安全策略、系统优越性、存在问题、应用效果进行了详细解析。  相似文献   

12.
本文提出了用既约分数序列逼近 2的矩阵算子法。有兴趣者 ,还可以从中引申出一些问题 ,并用电子计算机进行计算。  相似文献   

13.
结合餐饮业特点,介绍了餐饮POS机前台软件的设计思想和基本功能.  相似文献   

14.
本介绍了网络型“一卡通”消费POS系统中系统软件的改进和改进后的功能特点。  相似文献   

15.
对已有的N-gram平滑算法进行了系统地分析,分别实现了Absolute、W-B和Katz平滑算法.为解决传统Katz平滑算法在处理某些汉语固定搭配时无法进行概率折扣的问题,利用词性信息构造了新的折扣系数.新的折扣系数使词频越大,折扣越小,后接词越多,折扣越大,满足平滑算法对折扣系数的期望.试验结果表明:新的Katz平滑算法降低了N-gram模型的交叉熵,在汉语分词中应用改进的平滑算法也提高了分词结果的F量度.  相似文献   

16.
提出了一种基于一对一维布局结果使用边界种子的布局算法POS.该算法有以下特点:(1)能精确估计总连线长度的简单新颖的线性目标函数.(2)定义了边界单元和内部单元.(3)根据两个邻接的边界单元应具有最短连线长度来排序边界单元.(4)基于左边和底边边界单元的两方向种子布局.(5)用一对一维布局结果来构造二维布局结果.实验结果表明,当布局规模很大时POS算法是模拟退火算法总连线长度的40%,运行时间的0.02%,说明POS算法比模拟退火算法更快更有效率.  相似文献   

17.
对于一部分目前统计处理消歧效果较差、但出现频率又很高的兼类词,手工编写针对性极强的消歧规则。在未经词汇对齐的平行语料中,实现了基于个性规则的词性消歧方法。本研究为5个典型兼类词(过去、计划、与、back、so)设计的平行消歧算法,在大规模平行语料中得到了验证,平均F值达到了98.45%。研究结果表明该规则具有不受上下文长度和模板数量限制、特别适合于双语平行处理、消歧效果好等优点。  相似文献   

18.
对国际公约(协议、法律)语境中地理标志相关法律术语和我国法律(法规)语境中有关地理标志相关术语进行考辨;分析了来源地标识、地理标志、原产地名称三者的关系;指出我国有关原产地标记、地理标志等术语的认识有一个从混淆到厘清的过程。  相似文献   

19.
刍议名词、术语的选定与准确运用   总被引:3,自引:0,他引:3  
论述了名词、术语定名以及对它们进行规范与准确运用的若干原则,指出应当准确领会概念本身的含义,准确把握适合于名词、术语的语义环境,只有不背离语词的基本原意,才能更好地实现与时俱进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号