首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
汉字型姓名(以下简称姓名)转换为首音码的技术在各个领域已得到广泛应用.由于汉字的首音重码较多,一个姓名经转换会产生多个编码,通常的做法是根据建立者的理解确定一种编码方式.当其它用户使用首音码进行记录定位时,往往不知建立者选择重码音为何音,造成记录定位的失败.另外,当姓名转换首音码时,出现重码时需要选择,大大地降低了转换速度.在GBK汉字库范围内,通过分析汉字读音重码的情况,建立汉字首音码库,设计姓名自动转换成首音码编码和使用首音码进行记录定位的算法.  相似文献   

2.
该文用无存贮音码汉字字符串的音码反查实现技术,解决以往汉字型字符串在通过首音码或拼音全码进行反查时需要事先存贮汉字型字符串的音码作为辅助记忆码;解决一个汉字型字符串在转换音码时产生多个编码时需要选择问题;解决一个汉字型字符串由于转换时重码选择建立者与使用者的歧义问题。该文在GBK汉字库范围内,以首音码为例,使用汉字首音码库作为字典,实现无存贮音码汉字字符串的音码反查实现技术。  相似文献   

3.
陈海鹏 《电脑》1997,(2):15-15
随着计算机人工智能技术的不断发展,传统的编码式汉字输入法已经显得有些落伍.音码虽易学,但重码多、录入速度慢;形码虽重码少、录入速度快.但学习难度大一直是其尚待解决的难题;音形组合码的各项指标则介于二者之间,也未显示出更大的优势.95年初智能汉字输入法的出现,为汉字录入带来了勃勃生机,中文Win-dows中的“智能ABC”、天汇3.0中的“天汇ABC”、UCDOS 5.0中的“智能拼音”等新一代智能拼音输人系统,以初步的智能化特色,大为缓解了汉字录入速度与易学性之间的矛盾.但是,纵观当前的各种智能输入法,智能化的程度还非常低,系统主动参与的成分还很少,但是,我们毕竟从中看到了汉字录入智能化的广阔前景.那么,用户心目中理想的汉字智能输入系统又是什么样呢?希望笔者下面的论述能对广大开发人员有所裨益,并祝愿成熟的智能化汉字输入系统早日问世!  相似文献   

4.
语音代码──汉字智能转换研究   总被引:2,自引:0,他引:2  
在综述了语音代码一汉字智能转换(IPC)研究的发展和技术现状后, 本文就其研究的范畴问题提出作者的观点, 其中包括变换的形式定义, 研究所涉及的范围和困难问题, 变换效果的评价等, 在评价方面, 提出了转换的完备性、唯一性、攻义性、本原性攻义和非本原性歧义的概念文章就进一步研究提出了作者的建议, 希望本文提出的问题能起引起有关的讨论, 在充分认识研究的必要性和困难的基础上, 将其引向全面深入的发展。  相似文献   

5.
本文叙述了大陆和台湾计耳机汉字系统的内码结构, 在此基袖上, 提出了设计一个实现两种汉字文本文件转换系统的方法。  相似文献   

6.
中文信息处理是我国信息化建设的基础性环节,而汉字输入方法和技术则是其中的关键。本文对目前我国主流的各种汉字输入法的最新版本进行评述,并讨论适宜于古籍整理的输入法的基本特点,提出未来的智能输入法应走双引擎、多字集、音形结合道路的设想。  相似文献   

7.
重码自动区分技术是汉字键盘输入技术中的重要研究方向, 是解决编码易学和输入快速之间矛盾的有效方法。本文首先介绍了联想字库的结构和双向联想区分重码的技术原理, 接着阐述了压缩词库的存储结构以及区分重码所采用的查询、生成、匹配和剪切技术。  相似文献   

8.
该文从分析汉字特征信息编码的数字模型入手,介绍了在汉字输入方法研究中遇到的易学与重码的矛盾以及码长与重码的矛盾,对目前两类基于智能处理的输入法及“以字为基础,词为主导”的方法和“以词为驱动的整句转换”作了详细的分析,并对其代表性产品作了介绍。  相似文献   

9.
简介汉字输入方案的体系与探索汉字输入法的发展方向,深入浅出的分析汉字输入法的选择因人而宜.  相似文献   

10.
汉字智能书写已经广泛应用在PC、手写板、税控机,手机、学习机、导航仪、PDA等各众多办公与嵌入式领域,具有极为重要的作用。该文首先分析了汉字智能书写优点,其次,对汉字智能书写算法原理和汉字智能书写算法分析进行深入的探讨。最后,对汉字智能书写性能实验结果进行讲解,具有一定的参考价值。  相似文献   

11.
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。  相似文献   

12.
VFP中汉字拼音首字母的获取及应用   总被引:1,自引:0,他引:1  
论述了在VFP中获取汉字拼音首字母的原理及方法,给出了把汉字字符串转换为其拼音首字母字符串的程序流程图。  相似文献   

13.
基于语料库的中文姓名识别方法研究   总被引:25,自引:7,他引:25  
本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阈值。提出了在不作分词处理的原始文本中进行中文姓名识别的方法。经开放测试,召回率为95.23%;精确率为87.31% 。  相似文献   

14.
中文拼写纠错是一项检测和纠正文本中拼写错误的任务。大多数中文拼写错误是在语义、读音或字形上相似的字符被误用,因此常见的做法是对不同模态提取特征进行建模。但将不同特征直接融合或是利用固定权重进行求和,使得不同模态信息之间的重要性关系被忽略以及模型在识别错误时会出现偏差,阻止了模型以有效的方式学习。为此,提出了一种新的模型以改善这个问题,称为基于文本序列错误概率和中文拼写错误概率融合的汉语纠错算法。该方法使用文本序列错误概率作为动态权重、中文常见拼写错误概率作为固定权重,对语义、读音和字形信息进行了高效融合。模型能够合理控制不同模态信息流入混合模态表示,更加针对错误发生处进行学习。在SIGHAN基准上进行的实验表明,所提模型的各项评估分数在不同数据集上均有提升,这验证了该算法的可行性。  相似文献   

15.
分析了中文域名的仿冒攻击形式, 并且基于字符的点阵特性和贝叶斯分类原理, 提出了一种从单个字符的相似性到域名的整体相似性的中文域名仿冒检测方法, 并通过常用中文字库的实验对该方法的有效性进行了验证。实验结果表明了该方法可以对常见的中文域名仿冒方式进行准确检测, 并且其检测方法在未来可进一步适用于其他国际化域名的仿冒检测。  相似文献   

16.
针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验任务中用于检错评测的1000句测试集作为实验测试集,并与此会议提交的结果进行比较,实验结果表明,与基于复杂语言模型的检错方法相比,该方法在实现简单的同时也有很好的检错效果,获得了较高的准确率和精确率以及较低的误报率。  相似文献   

17.
针对现有很多基于人物属性特征的人名消歧方法不适用于文本本身特征稀疏的问题,提出一种基于句义结构分析中文人名消歧方法。通过句义结构分析提取人物关系特征词,根据提取关系特征构建社会关系图,并以人名实体的职业和所在单位等人物属性作为辅助特征,结合实体的特征信息进行关系聚类,将聚类的结果映射到文本中以实现人名消歧。通过句义结构分析提高了人物关系特征以及人物属性特征的准确率,实验结果表明,该方法可有效地提高中文人名消歧准确率。  相似文献   

18.
基于最大熵模型的中国人名自动识别   总被引:1,自引:0,他引:1       下载免费PDF全文
用最大熵模型自动识别中国人名。首先对语料库的词性进行角色替换,然后用特征模板从角色替换后的语料库中提取出特征集,接着用IIS算法训练特征集的最大熵参数,最后用viterbi算法对初分词文本进行角色标注,并在角色序列的基础上进行模式最大匹配,从而实现中国人名的自动识别。在封闭测试实验中,识别准确率、召回率、F-值分别达到了85.4%、91.2%、88.2%。  相似文献   

19.
中文问答系统中机构名的处理   总被引:1,自引:0,他引:1  
探讨问句中机构名的处理,并服务于中文问答系统。采用概念层次网络理论的语义概念分析方法分析问句,去掉与机构名无关的概念词语,得到候选机构名。对机构名全称库按字索引,在库中搜索出与候选机构名匹配的机构名全称并按拟合权值排序。实验结果表明该方法识别机构名的正确率达到90.6%,支持对机构名简称的处理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号