首页 | 本学科首页   官方微博 | 高级检索  
     

藏文字频统计系统中字构件分解算法
引用本文:才让卓玛,才智杰.藏文字频统计系统中字构件分解算法[J].计算机工程与科学,2011,33(3):159.
作者姓名:才让卓玛  才智杰
作者单位:青海师范大学藏文信息研究中心,青海,西宁,810008
基金项目:国家社科基金资助项目,青海师范大学科研基金
摘    要:藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整字角度统计分析藏文字频度属性,还要统计分析构成其构件的频度及位置属性。因此,在藏文字频统计系统中要分解构成藏文字的各部件。本文通过开发藏文字频统计系统,利用组合构件库结合藏文文法提出了一种藏文字构件分解算法。经测试,该算法不仅简单易行,而且可以有效地确定出各基本构件的位置特征,已应用于项目藏文字频统计系统。

关 键 词:字频统计  构件  分解

A Decomposition Algorithm for Words Components in the Tibetan Word Frequency Statistics System
CAI Rang Zhuo Ma,CAI Zhi Jie.A Decomposition Algorithm for Words Components in the Tibetan Word Frequency Statistics System[J].Computer Engineering & Science,2011,33(3):159.
Authors:CAI Rang Zhuo Ma  CAI Zhi Jie
Abstract:Tibetan word frequency statistics is a basic work for Tibetan information processing.Tibetan words are combined by the components from the vertical and horizontal directions,therefore,decomposing the Tibetan words components is the foundation to sum the attributes of such alphabetic writing.This paper is based on the development of the Tibetan word frequency statistics system,proposes a decomposition algorithm for Tibetan words,and the preliminary experiments show that this algorithm is not only simple and feasible,but also can effectively determine the location of each basic components.
Keywords:word frequency statistics  component  decomposition
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号