首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
维吾尔语名词构形词缀有限状态自动机的构造   总被引:1,自引:1,他引:1  
该文主要阐述维吾尔语词干提取中使用的名词构形词缀分析DFA的构造过程。维吾尔语属于黏着语,所以维吾尔语自然语言处理系统必须实现词干提取。词干提取的主要任务从单词提取词干和连接词干词尾的构形词缀。维吾尔语单词的构形词缀按照一定的规则连接到词干词尾,这使得维吾尔语构形词缀的连接规则可用有限状态自动机形式化描述。该文首先介绍维吾尔语名词的形态结构,然后根据规则构造从右向左的有限状态自动机,最后对这个自动机进行方向翻转和转换确定自动机操作。  相似文献   

2.
面向自然语言信息处理的维吾尔语名词形态分析研究   总被引:2,自引:3,他引:2  
名词是人类语言中的基本词类之一。维吾尔语是一种形态变化很复杂的语言,其中名词是一种形态变化复杂的词类。因此名词的形态分析研究无论在语法研究还是在语言信息处理中都非常重要。本文对维吾尔语名词的形态变化(名词的数、人称、格等语法范畴)进行了形式化的描述和分析。指出了维吾尔语名词的基本形态参数,总结出参数的组配规律并统计了其类型,探索了维吾尔语名词的削尾方法。这些工作将为维吾尔语名词形态处理提供有效的方法和新的思路。  相似文献   

3.
现代维吾尔语是黏贴性较强的语言。因此,词语尤其是动词所表示的语法意义主要通过附加成分"■-■-"来实现。该文主要探讨维吾尔语动词构形附加成分,并且对于它在形成动词的各种体-时等形式中的作用、特征及其构形规则进行初步的分析。  相似文献   

4.
以实现维吾尔语命令词识别为目的,重点研究维吾尔语命令词识别系统在Android平台下的开发与实现过程,介绍系统开发难点、核心技术及系统典型的几个功能。系统主要由Android开发包、Eclipse集成开发环境和API接口进行开发,并且通过自动选型规则来实现维汉英多种文字的正确显示及处理等问题,针对广大用户的不同说话方式,重新构建维吾尔语语音语法文件,解决各地不同方言问题。在一般实验室环境下做实验得到了90.56%的正确识别率和85.00%的成功执行率等测试结果,表明维吾尔语非特定人命令词识别研究中语法文件的结构及构建对系统有不同的影响。  相似文献   

5.
网络攻击的形式化建模探讨   总被引:2,自引:0,他引:2  
苏一丹  李桂 《计算机工程与应用》2004,40(23):135-136,168
随着网络入侵技术的不断发展,攻击行为表现出不确定性、复杂性和多样性的特点,攻击活动往大规模、协同化和多层次方向发展。网络攻击的日益复杂化迫切需要有一种新的描述方法对之进行有效的形式化建模,Z语言和确定有限自动机(DFA)是广泛使用的形式化工具,适合用来精确表示模型的语法和语义。文章建立了基于DFA的攻击模型,并在此基础上利用Z语言对之进行了有效的形式化描述。  相似文献   

6.
基于概念层次网络(HNC)理论,对多动词出现的一种情况——动词连见,进行了分类研究,给出了相应的处理规则。同时,还提出了一种基于BNF范式和产生式规则的形式化规则描述语言,完成了对规则的形式化描述和软件实现。在此基础上,对真实语料中出现动词连见的语句进行了计算机自动处理,给出了处理结果。  相似文献   

7.
通过对维吾尔语名词形态结构进行研究,构造了名词有限状态自动机(FSM);针对自动机的缺陷使用最大熵模型给有限状态自动机加入了歧义词缀识别能力,根据维吾尔语的元音和谐特点,建立了基于规则和信道噪声模型的元音和谐处理方法。有机地结合以上三种方法构造出了基于规则和统计的名词词干提取方法。为了有效利用现有的资源,提高系统的性能,把基于词典的词干提取方法与规则和统计结合的名词词干提取方法相结合,从而开发出多种策略相结合的维吾尔语名词词干提取系统。该系统具有较强的鲁棒性,准确率保持95%以上。  相似文献   

8.
本文以复杂特征理论为指导思想,对维吾尔语动词附加语素的多样性进行了初步的研究。维吾尔语附加语素可分为构词语素、构形语素和构词—构形语素等三种类型。这些附加语素在分类、语法形式、体、时、人称、数、附加条件等方面形成了不同的复杂特征。动词附加语素与词根或词干连接时有不同的附加规则。本文主要论述动词附加语素及其变体的多种分类、附加条件、动词附加语素的复杂特征的分类及表现形式,以动词直接陈述式一般过去时的附加语素为例进行特征结构之间的合一。  相似文献   

9.
接口自动机--一种用于组件组合的形式系统   总被引:2,自引:0,他引:2  
接口自动机是描述基于组件系统中组件及组件间交互行为的形式化工具。接口自动机在处理组件组合问题时所使用的“乐观方法”和博弈思想是区别于其它形式化工具的关键点。本文对接口自动机、时间接口自动机和资源接口及其中的博弈思想进行综述。在同其它形式化方法比较的基础上,指出了接口自动机的长处和局限。文中总结了接口自动机在理论上和实际中的意义并对其应用前景做了展望。  相似文献   

10.
建立典型的蠕虫扩散自动机模型,运用确定的有限状态自动机理论对蠕虫扩敞行为进行形式化描述,并且论证其正确性.本文提出一种扩敞描述语言,解决扩散自动机的形式描述、本质特征和执行过程问题.为研究蠕虫扩散行为提供一种更为直观的形式化手段.  相似文献   

11.
穆妮热·穆合塔尔      李晓    杨雅婷    艾孜尔古丽  周喜   《智能系统学报》2018,13(3):452-457
在自然语言理解、机器翻译、舆情分析等自然语言处理领域中,维吾尔谚语识别是整个文本实体识别的重要组成部分。为满足维吾尔谚语信息化的需求,本文构建了比较完善的维吾尔谚语语料库。同时,从传统语言学角度对维吾尔谚语的语法、语义结构进行分析,构建了一个由维吾尔谚语功能语类(词缀)组成的、专属维吾尔谚语规则的知识库,并将此知识库与自然语言处理技术相结合,实现一个既能够从文本中识别出维吾尔谚语,又能提供维汉互译等功能的信息软件系统。该系统也为开展计算机理解与处理维吾尔文字奠定了一个崭新的基础。  相似文献   

12.
极性情感词是准确分析维吾尔文倾向性的基础资源。该文在前期构建的维吾尔语褒贬情感词典基础上进行网络情感词的自动扩展研究。首先分析维吾尔语情感表达的语言特征,总结了连词、程度副词与情感词的搭配规律,并基于此规律设计从情感语料库中获取候选情感词的算法,形成候选情感词库;最后再利用维吾尔语连词的特性,结合已创建的情感词典和维吾尔语反义词词典,以互联网作为超大规模语料库,设计基于搜索引擎的情感词极性判别算法,根据算法得分判别候选情感词的极性,再将其扩展到已构建的褒贬情感词库。实验结果表明,与扩展前的情感词库相比,使用互联网文本语料扩展后的情感词库后进行维吾尔语句子倾向性测评的准确率和召回率均有明显提高。  相似文献   

13.
Aspect Oriented Programming can arbitrarily distort the semantics of programs. In particular, weaving can invalidate crucial safety and liveness properties of the base program. In this article, we identify categories of aspects that preserve some classes of properties. Specialized aspect languages are then designed to ensure that aspects belong to a specific category and, therefore, that woven programs will preserve the corresponding properties.Our categories of aspects, inspired by Katz’s, comprise observers, aborters, confiners and weak intruders. Observers introduce new instructions and a new local state but they do not modify the base program’s state and control-flow. Aborters are observers which may also abort executions. Confiners only ensure that executions remain in the reachable states of the base program. Weak intruders are confiners between two advice executions. These categories (along with two others) are defined formally based on a language independent abstract semantics framework. The classes of preserved properties are defined as subsets of LTL for deterministic programs and CTL* for non-deterministic ones. We can formally prove that, for any program, the weaving of any aspect in a category preserves any property in the related class.We present, for most aspect categories, a specialized aspect language which ensures that any aspect written in that language belongs to the corresponding category. It can be proved that these languages preserve the corresponding classes of properties by construction. The aspect languages share the same expressive pointcut language and are designed w.r.t. a common imperative base language.Each category and language is illustrated by simple examples. The appendix provides semantics and two instances of proofs: the proof of preservation of properties by a category and the proof that all aspects written in a language belong to the corresponding category.  相似文献   

14.
针对LibreOffice套件维吾尔文版本中存在的维吾尔文断行问题,进行了深入的分析和研究,归纳出一系列的维吾尔语断行规则,同时注重对行宽度、美观的需求,探讨了连接字形左边或右边、加连接字符进行拉长、音节符等问题。基于对开源办公软件LibreOffice的本地化框架研究,提出了按音节断行技术和自动拉长技术,设计出维吾尔文的基于音节的断行算法,并使该算法在维吾尔文LibreOffice中得以应用。  相似文献   

15.
句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分析算法;探索现代维吾尔语谓语的识别算法设计、其他句子成分的识别、自动界定预测算法等研究现代维吾尔语句子成分分析问题;解决现代维吾尔语句子成分分析系统实现、实验数据分析等现代维吾尔语句子成分分析问题。  相似文献   

16.
该文将初中数学维吾尔文教材作为研究对象,根据维吾尔语的特点和统计学原理理论,从计算语言学角度调查初中数学维吾尔文教材用词干情况。该文主要研究维吾尔语词干、教材概貌、数据处理技术相关概念及其算法及现代维吾尔语语料处理工具,获取教材中词干基本情况、新增词干、初中数学教材高频词干,开展了初中数学维吾尔文教材词干调查,为维吾尔语研究、维吾尔文数学教学与教材编纂等提供参考依据,从而更加积极有效地促进维吾尔语语言本身研究及其信息处理的发展。  相似文献   

17.
从喀什方言维吾尔语音合成的实际需求出发,在对照文本语料库的基础上,对比分析从标准维吾尔语到喀什方言的音位对应关系,根据增音、减音、换音等变位现象,总结相应的音位变化规则,构造基于有限状态自动机的转换模型及算法.实验结果表明,基于规则的自动转换算法具有良好的运行效果.  相似文献   

18.
为了实现维吾尔语文本的相似性检测,提出一种基于N-gram和语义分析的相似性检测方法。根据维吾尔语单词特征,采用了N-gram统计模型来获得词语,并根据词语在文本中的出现频率来构建词语—文本关系矩阵,并作为文本模型。采用了潜在语义分析(LSA)来获得词语及其文本之间的隐藏关联,以此解决维吾尔语词义模糊的问题,并获得准确的相似度。在包含重组和同义词替换的剽窃文本集上进行实验,结果表明该方法能够准确有效地检测出相似性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号