首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
藏语词性标注技术在藏文信息处理领域中占有十分重要的地位,本文主要对基于hmm的藏语词性标注技术进行了研究,所实现的词性标注系统主要通过隐马尔科夫模型对训练语料库进行数据统计,获取词性和词汇概率信息,并采用Viterbi算法进行标注。  相似文献   

2.
词性标注有很多不同的研究方法,目前的维吾尔语词性标注方法都以基于规则的方法为主,其准确程度尚不能完全令人满意。在大规模人工标注的语料库的基础之上,研究了基于N元语言模型的维吾尔语词性自动标注的方法,分析了N元语言模型参数的选取以及数据平滑,比较了二元、三元文法模型对维吾尔语词性标注的效率;研究了标注集和训练语料规模对词性标注正确率的影响。实验结果表明,用该方法对维吾尔语进行词性标注有良好的效果。  相似文献   

3.
文章提出了基于RoughSets的汉语兼类词初始标注规则的获取方法,并通过模糊神经网络(FNN)进行优化,最后再进行简化获取模糊规则;文章以人工标注过的句子作为训练集和测试集,得出了训练集左3、左4、右3、右4个兼类词标注规则库;对同样的训练集和测试集,采用统计二元模型进行标注后,再利用该方法(粗糙模糊神经网络方法,简称RSFNN)进行二次标注,结果表明RSFNN方法优于统计二元模型方法。最后实例说明汉语兼类词词性标注规则的获取方法。  相似文献   

4.
针对老挝语语料资源极少而无法直接利用有监督学习的方法实现老挝语词法分析的问题,提出了基于半监督学习的老挝语词性标注方法。首先利用仅有的少量标注词典和未标注语料资源,采用简单概率模型建模,获取较为完整的标注词典;其次利用整数规划获取大量自动标注的语料;最后在训练语 料充足的情况下,利用二阶隐马尔科夫模型建模,实现高质量的老挝语词性标注。提出的方法在老挝语词性标注方面取得了较好的效果,其准确率达到89.8%。  相似文献   

5.
吴晓慧  柴佩琪 《计算机工程》2003,29(2):151-152,160
汉语自动词性标注和韵律短语切分都是汉语文语转换(Text-to-Speech)系统的重要组成部分,在用从人工标注的语料库中得到韵律短语切分点的边界模式以及概率信息,对文本中的韵律短语切分点进行自动预测时,语素g这种词性就过于模糊,导致韵律短语切分点预测得不合理,该文提出了一种修改词类标注集,去掉语素g这种词性的方法,该方法在进行词性标注时,对实语素恰当地柰注出在句中的词性,以便提高韵律短语的正确切分,应用此方法对10万词的训练集和5万词的测试集分别进行封闭和开放测试表明,词性标注正确率分别可达96.67%和92.60%,并采用修改过的词类标注集,对1000句的文本进行了韵律短语切分点的预测,召回率在66.21%左右,正确率达到75.79%。  相似文献   

6.
汉语词性标注排歧方法探讨   总被引:4,自引:0,他引:4  
该文将概率统计的二元模型与三元模型用于汉语词性自动标注,在算法为线性阶的时间复杂度的情况下,对20万训练集和1万的测试集,分别进行封闭测试和开放测试,对稀疏矩阵零元素及词性标注的结果做了统计分析。  相似文献   

7.
英汉机器翻译系统中的词性标注研究   总被引:1,自引:1,他引:0       下载免费PDF全文
词性标注是英汉机器翻译系统中一个基础性的研究课题。提出了一种基于决策树的词性标注的非监督学习算法,在只有一个词库的有限条件下,通过决策树进行词性标注的非监督学习,生成词性标注规则。  相似文献   

8.
基于统计的汉语词性标注方法的分析与改进   总被引:17,自引:0,他引:17  
魏欧  吴健  孙玉芳 《软件学报》2000,11(4):473-480
从词性概率矩阵与词汇概率矩阵的结构和数值变化等方面,对目前常用的基于统计的汉语词性标注方法中训练语料规模与标注正确率之间所存在的非线性关系作了分析.为了充分利用训练语料库,提高标注正确率,从利用词语相关的语法属性和加强对未知词的处理两个方面加以改进,提高了标注性能.封闭测试和开放测试的正确率分别达到96.5%和96%.  相似文献   

9.
该文在分析了现有藏文词性标注方法的基础上,提出感知机训练模型的判别式藏语词性标注方法,重点研究了符合藏语词法特性的模型训练特征模板、模型训练和词性标注方法。并且在人工标注的测试集上获得了98.26%的词性标注精确率,可以实际应用到藏语自然语言处理中。  相似文献   

10.
一种基于共坐标上升算法的人名识别方法   总被引:1,自引:1,他引:0  
共坐标上升算法(coordinate ascent algorithm)是一种迭代优化技术,可以用来指导特征权值的训练。提出一种基于该算法的中国人名识别方法,避免了已有的一些方法中人为指定特征权值的问题,更好地体现特征之间存在的隐含关系。该方法从基础语料中获取特征库及成名概率词典,在训练语料上提取相应特征后,采用共坐标上升学习算法训练得到特征权重以及成名阈值参数,运用学习得到的各参数对普通文本中的中国人名进行识别。提出的方法无需对训练语料进行人工标注,在人名识别时也无需进行分词和词性标注处理,代价低、性能优良、有较好的实用性,在开放测试集上F1值达到93.02%。  相似文献   

11.
在深入分析传统软件测试过程模型特点的基础上,提出了一种新的软件测试过程模型——并行"与"模型,并详细描述了各阶段的具体任务,更贴切地描绘出软件测试活动的复杂关系,充分反映出软件测试活动与开发活动之间的时序性、层次性、迭代性和并行性。  相似文献   

12.
刘凯  梁欣  张俊萍 《计算机科学》2018,45(Z11):518-521
在对现有模型进行系统研究的基础上,提出了一种新的软件测试过程模型——并行“与”模型,并详细描述了各阶段的具体活动。该模型贴切地描绘出软件测试活动的复杂关系,充分体现出了软件测试活动与开发活动之间的层次性、并行性、时序性和迭代性。  相似文献   

13.
柳文  柳明 《计算机工程》2011,37(8):43-46
针对逻辑模型在查询和存储方面的不足,定义与其具有一致表示能力的关系模型,并将逻辑模型中以句子形式表示的逻辑约束转化为针对关系模型中逻辑关系的势的约束。根据模型的访问,以IEC61970所采用的数据访问接口DAF为例,在上述关系模型中给出基于关系代数的实现。研究结果表明,通过选择合理的关系模型,可以在保持逻辑模型丰富的表达能力的基础上,利用关系代数提高模型访问的效率,同时保证约束判定的有效性。  相似文献   

14.
数据模型及其发展历程   总被引:1,自引:0,他引:1  
数据库是数据管理的技术,是计算机学科的重要分支.经过近半个世纪的发展,数据库技术形成了坚实的理论基础、成熟的商业产品和广泛的应用领域.数据模型描述了数据库中数据的存储方式和操作方式.从数据组织形式,可以将数据模型分为结构化模型、半结构化模型、OLAP分析模型和大数据模型.20世纪60年代中后期到90年代初,结构化模型最早被提出,其主要包括层次模型、网状模型、关系模型和面向对象模型等.20世纪90年代末期,随着互联网应用和科学计算等复杂应用的快速发展,开始出现半结构化模型,包括XML模型、JSON模型和图模型等.21世纪,随着电子商务、商业智能等应用的不断发展,数据分析模型成为研究热点,主要包括关系型ROLAP和多维型MOLAP.2010年以来,随着大数据工业应用的快速发展,以NoSQL和NewSQL数据库系统为代表的大数据模型成为新的研究热点.对上述数据模型进行了综述,并选取每个模型的典型数据库系统进行了性能的分析.  相似文献   

15.
形状模型在混合建模环境中的映射研究   总被引:2,自引:1,他引:1  
混合建模技术是CAD研究继承参数化特征建模技术之后的又一研究热点,线框,曲面和实体模型3种模型间的转换是混合建模技术的核心,本文介绍了:1)实体模型到线框和曲面模型的映射;(2)线框模型到实体模型的映射,3)曲面框型到实体模型的映射,为混合建模技术做了一些有益的探讨,并将模型映射算法成功地应用于IGES和STEP的前后置处理器的设计中,取得了满意的结果。  相似文献   

16.
基于模型操纵的模型集成的主要研究对象是模型的输入输出参数,因此,本文给出了模型的二元组表示,即输入集、输出集,提出了模型组合关系与模型集成结果等概念,具体分析了模型集成结果的存在性问题,证明了其存在的几个充分条件,在证明中给出了在满足充分条件下模型集成的构造方法.  相似文献   

17.
数据在信息系统中的使用面临着这样一个困难,即:数据存储是以关系模型为基础,而软件开发以对象模型来进行,造成了软件开发中数据访问技术的不和谐。提出并建立了一个软件框架,并就对象模式到关系模式的转换进行了研究。  相似文献   

18.
计算机安全中的经典模型   总被引:1,自引:2,他引:1  
安全模型是构造安全计算机系统的基础。到目前为止,已有多种公开发表的安全模型。本文总结了几种重要的早期安全模型,其中包括访问矩阵模型,HRU模型,BLP模型、格模型和无干扰模型。并对它们进行了分类和简要评递。本文将它们称为经典安全模型。这些经典安全模型都是开创性的,从各个不同的方面对安全问题进行抽象,模型所定义的安全问题具有典型性,并对后续的研究产生了重要影响。目前,共享计算机系统的安全问题仍然是计算机科学的中心问题之一,研究这些经典模型,对于我们全面理解计算机系统的安全问题,展望未来发展方向,具有重要意义。  相似文献   

19.
根据目前软件开发的趋势,介绍了几种常见的软件开发的演化模型,包括增量模型、螺旋模型、并发开发模型等。简要介绍了每一种软件开发模型的工作过程、基本成分和演化过程,以及它们在现代软件开发中的应用情况。  相似文献   

20.
UML活动图的正确性决定了业务流程的正确执行,为此,提出一种UML活动图模型的正确性诊断方法。将模型分解后,对子模型进行模型验证,并对验证错误的子模型进行模型诊断,得到诊断结果。在质量管理过程实例中的应用结果表明,该方法能减小模型空间,减少诊断次数,准确锁定错误,有效地对模型的正确性进行诊断。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号