首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
针对如何在计算机中生成和显示方块苗文的问题,提出了一种方块苗文动态构造方法,给出了该方法的基本原理,定义了实现方块苗文动态构造所需要的操作符,并以谓词规则的形式对方块苗文动态构造变换操作进行了描述。该方法仅需存储方块苗文构件及独体字的显现字符,通过对显现字符进行上下组合、左右组合、侧围组合来实现方块苗文的动态构造,为方块苗文字库中字形构件提取及合体字自动生成技术提供了重要支持。  相似文献   

2.
为了减少字库中的数据存储量,在采用确定有穷自动机建立由构件组合变换得到方块苗文的字形映射关系的基础上,提出了一种支持构件复用的方块苗文字库开发方法,给出了基于该方法的方块苗文字库的具体开发过程。该方法根据字形映射关系,利用OpenType特征标签来设计反应构件自由组合替换规则和置位规则的特征脚本,以实现同一构件字形在不同方块苗文中的重复使用。测试结果表明,利用该方法开发的方块苗文字库具有存储量小、易扩充等优点,能够实现方块苗文同汉字、英文的混合显示,达到了实用性要求。  相似文献   

3.
根据方块苗文的造字原理和字形拓扑结构特征,提出了一种由构件汉语拼音的部分字母决定音码,由合体字结构类型决定形码,按照“先音后形”的次序生成编码序列的方块苗文字形输入编码方案,并使用上下文无关文法对方案进行了形式化描述,给出了方块苗文拆分取码的方法。测试实验表明,该方案具有码长短、重码率低的特点,基于该方案的输入法简捷快速、易学易用,能够解决从方块苗文字库中快速调出所需字形的问题。  相似文献   

4.
方块苗文是民间苗文的代表,其信息处理研究对于保护民间苗族文化遗产和弘扬苗族文化有着重要意义。字库开发是方块苗文信息处理研究内容的重要部分。根据方块苗文字库开发的实际需要,该文以文字结构分析为基础,提出了基于Unicode标准的方块苗文编码方案设计思想,介绍了方块苗文字符字模制作的基本步骤,并以标签定义、操作符定义和变换规则定义为重点,探讨了基于OpenType技术的方块苗文字库设计和开发的方法。测试结果表明,方块苗文OpenType字库具有文件小、易扩充等优点,能够解决英文、汉字和方块苗文的混排问题。  相似文献   

5.
方块苗文输入法是苗文信息处理研究的重要内容。输入法管理器—输入法编辑器(IMM-IME)是Windows提供的多语言支持的核心组件之一,为Windows环境下键盘输入法程序的开发提供了强有力的支持。在分析字形特点的基础上,研究方块苗文编码设计和字库创建的方法;结合Windows IMM-IME结构分析,以IME转换接口(CI)和IME用户界面(UI)的实现为重点,介绍Windows平台下接口式方块苗文键盘输入法的具体实现过程。  相似文献   

6.
自动地根据用户请求进行服务的动态组合是目前Web服务领域的关键问题.针对该问题,提出了一种基于本体的服 务动态组合方法,设计并实现了一个服务动态组合原型.首先Web服务按照一定规则被抽象为本体模型,然后通过分析所 构造服务的模型来实现服务的匹配,最后利用BPEL4ws对匹配生成的服务组合序列来进行自动的组合.实验结果表明,该 方法细化了服务接口的语义,并且在发现结果上有更高的准确性.  相似文献   

7.
构件组装测试通过组合构件模型来实现,容易产生状态空间的爆炸,且生成用例会重复单元测试的一些工作.针对此问题,提出了通过生成交互路径来进行构件组装测试的方法,并给出了生成交互路径的过程与算法.该方法可以更有效地生成组装测试用例,并能够避免模型组合时状态空间爆炸的问题.实例分析证明,该方法拥有较好揭错能力,计算量小且具有通...  相似文献   

8.
基于谓词切片的字符串测试数据自动生成   总被引:3,自引:0,他引:3  
字符串谓词使用相当普遍,如何实现字符串测试数据的自动生成是一个有待解决的问题,针对字符串谓词,讨论了路径Path上给定谓词的谓词切片的动态生成算法,以及基于谓词切片的字符串测试数据自动生成方法,并给出了字符串间距离的定义,利用程序DUC(Definithon-Use-Control)表达式,构造谓词的谓词切片,对任意的输入,通过执行谓词切片,获取谓词中变量的当前值,进而对谓词中变量的每一字符进行分支函数极小化,动态生成给定字符串谓词边界的ON-OFF测试点,实验表明,该方法是行之有效的。  相似文献   

9.
利用语料库技术的中文自动文摘系统   总被引:2,自引:0,他引:2  
本文着重介绍利用“后邻字符树”的方法在领域语料库中生成字符树库,用于自动文摘候选句子选取时提高精度,介绍了后邻字符树的构造、后邻字符树库的生成及优化和句子权值计算方法。  相似文献   

10.
字符笔划在字符识别等领域中存在广泛的应用。针对字符图形的骨架化及笔划提取,本文提出了一种基于动态约束Delaunay三角剖分的算法。该方法首先通过对字符的轮廓多边形进行三角剖分,生成一系列具有拓扑关系的三角形,再根据三角形的三种类型生成各三角形骨架,并连接为整个字符的骨架。然后定义了骨架的平滑度函数及分支长度阈值,消除了畸变分支,并根据得到的骨架进行笔划分割。实验结果表明,该算法具有快速稳定的特点且鲁棒性较好。  相似文献   

11.
智能型汉字数码输入技术的研究   总被引:1,自引:0,他引:1  
针对数字编码的特点,本文提出了一种在不改变编码方案的情况下通过改进输入规则,结合语言模型,实现汉字数字编码的智能输入技术。文章首先讨论了怎样设计字词码本结构,使之能够满足灵活多样的输入方式,继而设计了一种动态自学习语言模型,重点分析了数据平滑算法在语言模型中的应用与改进,最后通过一个输入法示例程序,对改进前后不同情况下的输入效果进行了测试。实验表明,这种输入技术不但降低了输入法的平均码长,而且显著地提高了首字命中率。  相似文献   

12.
如何高效逼真地动态重现书法作品的创作过程日益成为亟需解决的问题,因此文中提出基于主曲线的书法字动态重现方法,解决当前细化算法在提取骨架时存在的无效分支较多、不能保证笔画的连续性和准确性的问题.结合书法字自身结构对主曲线算法进行改进和优化.对书法图像进行骨架提取、骨架追踪、笔顺获取等处理,结合骨架信息和二值图像实现笔画宽度复原,针对笔画宽度存在的“肿瘤”问题,提出“角点剔除法”进行修正,结合HTML5的Canvas绘图技术进行书法字动态书写过程.在模拟数据集上的实验表明,文中算法的书法动态重现取得较好效果.  相似文献   

13.
本文从语言使用的局部性原理出发,引入动态语境网的概念,提出了在汉语音节→汉字转换中的动态语境学习方法,有效地提高了音节汉字的转换正确率。  相似文献   

14.
王小伟 《计算机仿真》2020,37(3):288-291,429
针对网络顽健性动态增强过程网络区域划分不均,导致增强效率低和能耗高的问题,提出基于重叠分片法的网络顽健性动态增强方法。计算最优簇首数量,确定非测距定位技术和测距定位技术对节点的位置,利用节点位置划分网络区域。将事件信息传送到汇聚节点过程中存在的偏差,与自适应最小均方误差滤波算法和时空相关理论相结合,建立节点数据优化模型和通信频率优化模型,确定传递事件信息的最佳通信频率和最少激活节点总数,实现网络顽健性的动态增强。仿真结果表明,所提方法的增强效率高、能耗低且能有效反应网络不稳定节点输出的动态信号。  相似文献   

15.
近年来,随着深度学习的快速发展,面向自然语言处理领域的预训练技术获得了长足的进步。早期的自然语言处理领域长期使用Word2Vec等词向量方法对文本进行编码,这些词向量方法也可看作静态的预训练技术。然而,这种上下文无关的文本表示给其后的自然语言处理任务带来的提升非常有限,并且无法解决一词多义问题。ELMo提出了一种上下文相关的文本表示方法,可有效处理多义词问题。其后,GPT和BERT等预训练语言模型相继被提出,其中BERT模型在多个典型下游任务上有了显著的效果提升,极大地推动了自然语言处理领域的技术发展,自此便进入了动态预训练技术的时代。此后,基于BERT的改进模型、XLNet等大量预训练语言模型不断涌现,预训练技术已成为自然语言处理领域不可或缺的主流技术。文中首先概述预训练技术及其发展历史,并详细介绍自然语言处理领域的经典预训练技术,包括早期的静态预训练技术和经典的动态预训练技术;然后简要梳理一系列新式的有启发意义的预训练技术,包括基于BERT的改进模型和XLNet;在此基础上,分析目前预训练技术研究所面临的问题;最后对预训练技术的未来发展趋势进行展望。  相似文献   

16.
AJAX动态技术的广泛应用,增加了WEB项目开发的复杂性和难度。AJAX框架技术有效地解决了这一问题,在实现功能的同时提高了开发效率,具有推广意义。讨论了AJAX技术的特点和应用情况,并针对基于AJAX的动态客户端开发中的效率阀题,提出了使用DWR框架设计实现AJAX应用效果的实例解决方案,采用客户端脚本语言对服务器端远程调用技术完成动态显示功能,优化了开发效率,并给出动态HTML页面中部分代码和服务器端的设计方法。  相似文献   

17.
一种利用校对信息的汉字识别自适应后处理方法   总被引:1,自引:1,他引:0  
后处理技术是汉字识别系统的重要组成部分。传统的识别后处理技术在很大程度上依赖于所训练的统计语言模型,没有考虑所处理文本的特殊性;而且没有利用识别器的动态识别特性。本文利用部分校对过的正确本文信息,一方面可以构建自适应语言模型,及时发现所处理文本的语言特点;另一方面可以利用识别器的动态识别特性,以修正候选字集;从而使得后续文本的识别后处理具有自适应性。40 万字的数据测试表明:这种方法的文本平均错误率较传统的后处理方法下降35.24%了,可以大大减轻数据录入人员的工作量,具有较高的实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号