首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。  相似文献   

2.
基于可信度的中文完整词自动识别   总被引:1,自引:0,他引:1  
中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求。  相似文献   

3.
陈壮 《中文信息学报》2007,21(4):122-128
标准化是实现技术产业化的基础。中文信息处理技术是我国特有的、具有国际领先水平的技术。我国自 20 世纪80 年代参与ISO/ IEC J TC1/ SC2 的活动以来,在中文编码技术的国际标准化工作中取得了显著成绩。本文介绍了ISO/ IEC J TC1/ SC2 的工作领域、工作方式和组织结构;我国参与ISO/ IEC J TC1/ SC2 及其下属该组织活动的方式;国际标准ISO/ IEC 10646 的大致情况和我国在参与此国际标准研制工作中取得的成绩、当前的工作和未来工作的计划。本文论述了我国参与本文ISO/ IEC J TC1/ SC2 活动的意义,以及我国在ISO/ IEC J TC1/ SC2 活动中的作用、地位和影响。作者还提出了对未来工作的建议。  相似文献   

4.
随着以PDA和智能手机为代表的手持设备快速发展,汉字输入法选择余地小的缺点已经成为影响其普及的障碍之一。究其原因是手持设备中的操作系统和物理设备类型多,而开发的汉字输入法在不同手持设备中不通用,造成开发效率低。本文介绍了一个适用于手持设备的多层的通用汉字输入法模型,详细描述了模型中每一层的功能和特点,讲解了如何基于该模型实现一个输入法,并概要论述了本模型的优点。  相似文献   

5.
本文论述了基于ISO10646的编辑器VI/EX的设计与实现。首先对通用多八位编码字符集(UCS)的体系结构及其编码体制作了简要介绍,然后描述了编辑器VI/EX的总体设计,并详细论述了编辑器中内部文本组织和屏幕显示控制的实现方法。  相似文献   

6.
中文分词是计算机自动处理文本的基础。通过比较常用的机械分词算法的优缺点,提出了分层逐字二分算法,综合了TRIE树和逐字二分分词的特点,以求通过较小的开销来实现较快的匹配速度。实验结果表明,该算法在综合性能上有显著提高。  相似文献   

7.
冯丽萍 《福建电脑》2006,(1):147-147,124
本文针对有特征词的中文组织机构名进行了研究,以搜狐网站的2004年11—12月人民日报网页中涉及社会、经济、法律、教育等内容的50万字语料为基础。通过计算中文组织机构名的构词可信度对组织机构名进行识别。经测试准确率达90%以上。召回率达93.5%以上。  相似文献   

8.
为了改进现有键盘的字母布局,使之更能适用于汉字拼音输入法,该文根据键盘布局的设计原则、相关的科学原理和基于汉字、拼音字母使用频率的统计数据,设计出一种较为合理的、适用于汉字拼音输入法的键盘布局。该文从静态、动态工作量和左右手交替率三方面,与现有键盘的字母布局进行比较。在工作量方面,对于同一手指新的键盘布局依食指、中指、无名指、小指呈线性递减关系,较好地符合各手指实际可承受负荷量,而其左右手放宽条件下的交替率为0.748 33,分析数据可知新设计出的键盘字母布局在汉字拼音输入法的输入效率方面有着显著的提高。  相似文献   

9.
基于监督学习的中文情感分类技术比较研究   总被引:6,自引:0,他引:6  
情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,其中各种有监督学习方法的分类效果以及文本特征表示方法和特征选择机制等因素对分类性能的影响更是亟待研究的问题。本文以n-gram以及名词、动词、形容词、副词作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,以中心向量法、KNN、Winnow、Nave Bayes和SVM作为不同的文本分类方法,在不同的特征数量和不同规模的训练集情况下,分别进行了中文情感分类实验,并对实验结果进行了比较,对比结果表明: 采用BiGrams特征表示方法、信息增益特征选择方法和SVM分类方法,在足够大训练集和选择适当数量特征的情况下,情感分类能取得较好的效果。  相似文献   

10.
随着可视化技术在教学、商业、娱乐中的广泛应用,市场对于大屏幕高清晰的需求日益增强,但是由于单个显示屏幕的分辨率是有限的,而且随着分辨率的提高,系统成本呈指数级上升。因此,通过整合多个显示屏幕实现多投影显示系统(即多屏幕绘制系统)已成为构造低成本、高亮度、高分辨率显示系统的最佳方案之一。多屏幕绘制系统,由多台投影仪通过叠合拼接而成的,能够输出高亮度、高分辨率图像的大规模显示设备。与单台同样性能的显示设备相比,多屏幕绘制系统具有成本低和易扩展等优势。  相似文献   

11.
“炎黄”中文平台结构设计   总被引:2,自引:1,他引:2  
随着我国计算机应用水平的提高, Internet的迅速普及, GB2312 - 80中的6763个汉字已不能满足应用的需要。ISO 10646标准的制定,使得为开发支持大汉字字符集的中文平台提供了宽阔的代码空间。 我们的工作目标就是探讨在现有的的开放系统上,提供支持ISO 10646标准CJK大字符集、支持多种内码、兼容现有中文平台、与原英文系统及版本无关、符合国际、国家标准、具有一定跨平台功能、实用高效的中文平台解决方案及实现技术。 本文详细阐述了该中文平台的设计目标、模块结构、以及各个子系统的实现方法。  相似文献   

12.
基于特征串的大规模中文网页快速去重算法研究   总被引:16,自引:1,他引:16  
网页检索结果中,用户经常会得到内容相同的冗余页面,其中大量是由于网站之间的转载造成。它们不但浪费了存储资源,并给用户的检索带来诸多不便。本文依据冗余网页的特点引入模糊匹配的思想,利用网页文本的内容、结构信息,提出了基于特征串的中文网页的快速去重算法,同时对算法进行了优化处理。实验结果表明该算法是有效的,大规模开放测试的重复网页召回率达97.3% ,去重正确率达99.5%。  相似文献   

13.
宜万兵  秦红磊  路辉 《计算机测量与控制》2008,16(7):1011-1013,1016
实时仿真系统能够准确真实地反映当前的状态,文章探求基于不同总线的多总线的融合技术以及多任务系统任务分配方法的设计,提出了不同类型仪器间的同步和触发的解决方法;在项目中采用了PXI,VXI,LXI以及GPIB总线仪器,通过融合各种仪器总线和平台搭建出一个基于LAN混合实时仿真系统,并采用了多线程工作机制,分配不同权重等级任务的执行顺序,优化了软件的运行模式;实验证明,该系统完全满足复杂系统中信号实时仿真的要求。  相似文献   

14.
基于统计学习的挂马网页实时检测   总被引:1,自引:0,他引:1  
近年来挂马网页对Web安全造成严重威胁,客户端的主要防御手段包括反病毒软件与恶意站点黑名单。反病毒软件采用特征码匹配方法,无法有效检测经过加密与混淆变形的网页脚本代码;黑名单无法防御最新出现的恶意站点。提出一种新型的、与网页内容代码无关的挂马网页实时检测方法。该方法主要提取访问网页时HTTP会话过程的各种统计特征,利用决策树机器学习方法构建挂马网页分类模型并用于在线实时检测。实验证明,该方法能够达到89. 7%的挂马网页检测率与0. 3%的误检率。  相似文献   

15.
徐大林  高文政 《测控技术》2006,25(5):42-45,50
采用多极旋转变压器的粗、精轴角组合可以大大提高轴角测量精度.依据粗、精轴角组合误差产生及其纠错原理,提出了基于FPGA器件实现多极旋转变压器粗、精数据组合与纠错的两种双速处理器技术方案,并解决了FPGA器件应用中的资源、速度有限的关键技术,研制出了粗精组合双速处理器.  相似文献   

16.
吕闽晖  熊伟  沈来信 《计算机科学》2016,43(11):130-134
为了提高多群多点广播中继网络系统的性能,提出一种改进的协作中继多点广播码分多址(CDMA)系统设计。该方案利用协作中继辅助的分布式波束形成 实现单天线基站多播,获得了较好的空间分集增益。在该系统中,多个基站利用多个中继节点向多个目的地的各个小组传播消息;利用CDMA技术来减少中继节点以及目的地节点的多址干扰(MAI)障碍,同时每个中继节点作为线性预编码波束合成器,可以在合适的代码空间重塑基站信号;对线性波束形成矩阵进行优化,使得中继节点的功率最小化,从而满足QoS在信号干扰噪声比方面的要求。系统性能仿真对比实验的结果表明,提出的改进方案明显优于传统的正交复用方案(FDMA / TDMA)。  相似文献   

17.
介绍了一种基于NI Visoin汉信码图像处理系统,该系统采用LabVIEW开发平台,对系统的实现进行了详细的讨论,给出了图像采集模块的部分G语言代码。实验结果表明,该系统具有较高的测试精度和效率,操作简便。  相似文献   

18.
分析了嵌入式框架在实际应用中存在的不足,设计并实现了一种基于正则表达式的抓取网页源码方法。并在asp.net 环境下,用C#语言实现了该方法。这种方法有生成页面简单、快速的优点,提高了网页的可读性、安全性,生成的页面也更利于设计者使用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号