排序方式: 共有20条查询结果,搜索用时 31 毫秒
1.
同一个字符拥有不同的计算机内部代码,这意味着有两个或两个以上字形在人的眼中是同一个字,而计算机却认为是不同的字。这种“人机看法不一致”会给语言信息处理带来混乱,导致信息检索不全,统计数字不准,字词分类排序不一致等情况。该文结合Unicode实例专题讨论当前计算机上存在的中文同形异码字问题,包括 (a) 私人造字公有化所形成的同形异码字,(b) 兼容编码所形成的同形异码字,(c) 建立专门的笔画部首表而形成的同形异码字,(d) 半宽和全宽字形分别编码而造成的同形异码字等,并探讨解决问题的方法。 相似文献
2.
3.
4.
粤语和普通话之间的机器翻译研究应首先考虑由粤语到普通话的书面语翻译,并以单词为突破口。本文重点讨论粤-普书面语机器翻译中的词处理,尤其是方言词处理,包括方言词的识别和方言词的翻译两方面,同时介绍一个已经初步实现了的单词级粤-普机器翻译试验系统。文章最后将给出结论和讨论。 相似文献
5.
本文分析了校企合作共建移动通信技术研究机构的意义,介绍了共建研究机构的具体作法,探索了"校企合作共建研究机构"的优势,初步建立了深度融合的校企合作共建移动通信技术研究机构的机制,与行业企业形成了良性互动关系。 相似文献
6.
焊接机器人系统通讯接口设计包括软件设计和硬件设计两个方面,焊接机器人控制系统通常为分散式的结构,机器人本体控制系统与焊接控制系统是相互分离的。本文对焊接控制系统与焊接机器人控制系统之间的信号通讯关系进行了分析,同时探讨了系统的工作时序,提出了一种通信接口线路。 相似文献
7.
《全衡》词典的设计与建设 总被引:2,自引:0,他引:2
《全衡》是第一个较全面考虑香港和国际的需求的网上汉字输入系统,其核心部件是词典。《全衡》使用的是一部拥有六万余词条的词典,每一词条讲述一个词语,信息包括该词语的简体字形式、繁体字形式、汉语拼音表达式、粤语拼音表达式、仓颉输入法代码、速成输入法代码等。由其中任何一项入手,借助于系统中的检索程序可以方便地查找其它各项信息。这不仅有力地支持了汉字输入,对于汉语学习也很有帮助。本文简要介绍《全衡》的词典建设。 相似文献
8.
正易全:一个动态结构笔组汉字编码输入法 总被引:3,自引:1,他引:3
“正易全”是一个以“正”、“易”和“全”为基本指导思想的笔组型汉字编码输入法。在“正”方面,采用国际标准汉字集ISO10646 CJK, 并以《GB13000.1字符集汉字字序(笔画序)规范》和《信息处理用GB13000.1字符集汉字部件规范》指导编码;在“易”方面,以单双笔笔组和十来个常用部件为码元,按笔顺和音托等简单原则映射到26个英文字母建元上,从而避免了传统的繁复字根-键元对应表;在“全”方面,支持CJK中的所有20902字符,包括简体字、繁体字、日韩字和偏旁部首等,而且可以在不改变编码方案的前提下进一步扩充字集。正易全的单字最大码长为5个字母,平均码长4.315,键选率16.4%。该输入法的笔组-键元设计和取码模式是在对整个CJK字集作了全字编码以后多次试验、统计和优化后确定下来的。 相似文献
9.
10.
也谈汉语书面语的分词问题——分词连写十大好处 总被引:2,自引:1,他引:1
单词的切分对现代汉语的运用、研究和计算机信息处理等都具有相当重要的意义。本文阐述书面汉语分词连写的十大好处, 并讨论一些实施方面的问题。文章全文分词连写。 相似文献