首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。  相似文献   

2.
陈壮 《中文信息学报》2007,21(4):122-128
标准化是实现技术产业化的基础。中文信息处理技术是我国特有的、具有国际领先水平的技术。我国自 20 世纪80 年代参与ISO/ IEC J TC1/ SC2 的活动以来,在中文编码技术的国际标准化工作中取得了显著成绩。本文介绍了ISO/ IEC J TC1/ SC2 的工作领域、工作方式和组织结构;我国参与ISO/ IEC J TC1/ SC2 及其下属该组织活动的方式;国际标准ISO/ IEC 10646 的大致情况和我国在参与此国际标准研制工作中取得的成绩、当前的工作和未来工作的计划。本文论述了我国参与本文ISO/ IEC J TC1/ SC2 活动的意义,以及我国在ISO/ IEC J TC1/ SC2 活动中的作用、地位和影响。作者还提出了对未来工作的建议。  相似文献   

3.
ISO/IEC和ITU-T联合制定的H.264标准,是目前最新的视频压缩标准。该标准采用一系列最新的压缩技术,提高了压缩率。本文重点介绍了视频编码标准H.264的关键压缩技术,并阐述了它在数字电视、高清晰度电视以及移动通信等方面的应用前景。  相似文献   

4.
新视频压缩标准H.264/AVC的研究   总被引:3,自引:0,他引:3  
H.264/AVC是由ITU T视频编码专家组和ISO/IEC运动图像专家组成立的联合视频专家组制定的最新视频编码标准。H.264/AVC标准的主要目标是增强压缩性能,并提供“网络友好”的视频表达。概述了H.264的特点及应用,并详细介绍了H.264/AVC的核心技术。  相似文献   

5.
基于汉字发生器的汉字字形CAD系统的设计   总被引:1,自引:1,他引:0  
本文提出一种基于汉字发生器的汉字字形计算机辅助设计系统的设计方案,系统功能上分为设计笔划形体和快速造字两部分, 在设定了笔划形体之后, 就能方便快速制造该字体的全字号、全字集的汉字。在ISO 10646 CJK 大字库的开发中, 初步得到验证, 综合性能高, 具有现实意义。  相似文献   

6.
随着ISO10646的出台,庞大的汉字词集的属性分析是一个迫切需要解决的难题,本文主要阐述了采用C/S模式的汉字词属性分析和重组系统的数据模型,并简单介绍了系统的设计要点。  相似文献   

7.
周斌  严德聪  杨宗凯 《计算机工程与设计》2004,25(9):1523-1525,1532
为了取得更高的图像压缩性能和更多的实用功能,ISO/IEC MPEG(运动图像专家组)和ITU-TVCEG(视频编码专家组)共同制订了一套新的视频编码标准H.264/AVC。介绍了H.264/AVC图像编解码系统的实现过程,对其采用的新技术进行了描述,最后将其与H.263和MPEG-4标准进行了性能对比。  相似文献   

8.
自1991年以来,尤其是ISO/IEC10646(UCS)公布之后,国际化工作成为国际标准化组织及各国、各大厂商瞩目焦点,本文简要介绍国际化工作的历史,目前国内、外动态及工作进展情况。  相似文献   

9.
多文种环境下汉字内码识别算法的研究   总被引:9,自引:4,他引:9  
汉字内码向ISO/IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题,并提供了多种汉字内码识别算法,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上,本文对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到99.9%以上。  相似文献   

10.
周华 《福建电脑》2006,(4):58-59
文章分析了一个新的数字视频编码标准H.264,H.254是ITU-T的VCEG和ISO/IEC的MPEG的联合视频组 (JVT)开发的一个新的数字视频编码标准,是具有运动补偿技术的帧间预测编码。同MPEG构成mp4的技术基础。H.254草案中包含了用于差错消除的工具,便于压缩视频在误码、丢包多发环境中传输,如移动信道或IP信道中传输的健壮性。其应用前景应是不言而喻的。  相似文献   

11.
Most visual search studies have been restricted to alphanumeric stimulus materials. Research related to scanning patterns of Chinese characters is sparse. This study is an attempt to understand the differences and similarities in visual search of Chinese characters having a varying degree of complexity among Hong Kong Chinese, Mainland Chinese and Chinese reading non-Chinese people. Eighteen participants were tested on Chinese character screens with three layouts (row, column, and uniform separation) and two word complexities (high and low). The 18 participants comprised six Hong Kong Chinese, six Mainland Chinese and six non-native Chinese readers. Performance data and eye movement data were recorded. The percent correct and search time were the two performance measures. A new measure, called HV-ratio was developed to characterize eye movements. The results show that Hong Kong Chinese use predominantly horizontal search patterns while the Mainland Chinese change their search pattern depending on the layout presented. Non-native Chinese readers, on the other hand, do not seem to show any preference on scanning strategy for a given layout. Word complexity did not show any significant effect on search time. Potential reasons for these differences and design implications are discussed.  相似文献   

12.
一种笔段网格汉字字形描述方法   总被引:7,自引:0,他引:7  
现有计算机汉字字形描述方法在特征选取、字形比对计算方面存在缺陷,无法解决输入错字、古籍异体字、拼合字和自动比对字形等问题.面向应用提出一种具有颗粒度适当、无歧义、规范化基元特征,能描述一切可能字形(包括错字、异体字、拼合字)骨架异同的笔段网格汉字字形描述方法,并基于该描述给出了简单笔画、复合笔画分类及自动提取、结构关系计算等算法.实验表明,该方法可用于支持各种字形的描画输入和字形整体、局部比对计算.  相似文献   

13.
一种基于云端信息保护的汉字计算模型   总被引:1,自引:0,他引:1  
提出了一种基于信息内容保护的信息安全模型。该模型利用将汉字笔画抽象为有向图的方法,设计了汉字笔画图抽象的具体方案,实现了对汉字字形结构的动态描述;建立了动态汉字字形描述库,设计了汉字字形的生成算法,实现了汉字字形的Web存储和特征字形的客户端输出。所提模型为汉字信息的云端存储和云端数据安全性保护提供了一种解决方案,不仅有助于汉字信息的安全保护,而且有助于汉字认知计算、语义计算等深度汉字信息计算。  相似文献   

14.
命名实体识别(NER)作为自然语言处理的重要部分,在信息抽取和知识图谱等任务中得到广泛应用。然而目前中文预训练语言模型通常仅对上下文中的字符进行建模,忽略了中文字符的字形结构。提出2种结合五笔字形的上下文相关字向量表示方法,以增强字向量的语义表达能力。第一种方法分别对字符和字形抽取特征并联合建模得到字向量表示,第二种方法将五笔字形作为辅助信息拼接到字向量中,训练一个基于字符和五笔字形的混合语言模型。实验结果表明,所提两种方法可以有效提升中文NER系统的性能,且结合五笔字形的上下文相关字向量表示方法的系统性能优于基于单一字符的语言模型。  相似文献   

15.
进一步的“正易全”——三级汉字编码输入法   总被引:1,自引:0,他引:1  
本文报告“正易全”汉字输入法的新进展。从整体上来讲,正易全已发展成为全字笔顺、全字笔组和2 21 笔组三级输入法系列。前两级简单灵活,键选率极低,方便大字集查检;第三级在常用字和通用字中表现极佳,适合日常快速打字。在编码技术上,多笔笔组码元的选用、单结构的定义和多结构字的二部划分等方面都作了进一步的简化、系统化和规律化。此外,码表在GB1300011 字符集的基础上增加了1164 个港澳台地区用字或字形。  相似文献   

16.
《全衡》词典的设计与建设   总被引:2,自引:0,他引:2  
《全衡》是第一个较全面考虑香港和国际的需求的网上汉字输入系统,其核心部件是词典。《全衡》使用的是一部拥有六万余词条的词典,每一词条讲述一个词语,信息包括该词语的简体字形式、繁体字形式、汉语拼音表达式、粤语拼音表达式、仓颉输入法代码、速成输入法代码等。由其中任何一项入手,借助于系统中的检索程序可以方便地查找其它各项信息。这不仅有力地支持了汉字输入,对于汉语学习也很有帮助。本文简要介绍《全衡》的词典建设。  相似文献   

17.
目前使用的汉字有简体和繁体两大形式:中国大陆和新加坡等地使用简体字,我国港澳台地区和部分海外华人社区使用繁体字。其中大多数简体字的意义和用法与对应的繁体字是一样的,具有一一对应关系,这种情况通过查找简繁对照表就可以正确处理。然而,还有相当一部分简体字对应多个繁体字,这是简繁字转换的重点和难点。基于此背景提出基于对照表以及语义相关性的简繁汉字转换方法。在教育部语信司及中国中文信息学会联合举办的一对多简繁转换评测中,此一对多简繁转换系统以95.6%的准确率排名第一。  相似文献   

18.
汉语是一种开放大字符集语言,汉字字形相似度计算是汉语信息处理的一项基础研究,对于汉字识别、计算机辅助的汉语文章校对和汉字教学都有重要作用.本文对现有汉字字形结构描述方法从图形相似角度进行了改进,并给出了一种基于结构描述的字形相似度计算算法,该方法计算相似度无需字形样本实例的学习训练,对于常用字和难于获取书写样本的生僻字的相似度计算,都具有很好的适应性,可满足不断扩大的汉字集合计算相似度的需要.实验表明,采用此法计算得到的GB2312中6763个汉字的相似字表,与人的认知结果吻合度很好,并应用于计算机辅助校对系统中的别字修改提示,显示出较好效果.  相似文献   

19.
古文字字库建设的几个问题   总被引:1,自引:1,他引:1  
随着古文字信息化处理研究的发展,古文字的标准字库建设已经显得十分迫切。本文探讨了古文字标准字库建设中需要注意的四个方面的问题:通过建立古文字资料库,穷尽性地收集整理古文字字形保证字形收集的全面性,通过拓片扫描造字保证所造字形的准确性;在字形与字之间建立对应关系时须考虑两者之间的异用、歧释、异体等复杂关系;字形归纳过程中应遵循形体的归并原则和区别原则;字符进入标准字符集时的分级应根据字频原则和形频原则。  相似文献   

20.
林民  宋柔 《计算机科学》2007,34(11):185-188
本文分析了目前汉字处理应用中存在的主要问题,归纳出问题的核心是由于缺少能涵盖一切可能汉字的、可计算的字形形式化描述体系,从而造成应用中有一系列障碍。发现了现有字形描述方法共同存在的特征选取缺陷,最后给出了一种可行的汉字网格字形描述方法,该方法不仅能表示一切可能的汉字字形(包括错字),而且为字形特征异同的自动计算奠定了可靠的基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号