期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘新东 Eiffel Chen 应群民《工业控制计算机》2006,19(3):49-51

目前嵌入式产品中越来越多地要考虑各国字符的存储与显示问题,某些嵌入式系统需要提供完整的汉字显示,而某些系统只需要提供必要的、有限数量的汉字显示.结合作者从事嵌入式软件开发和嵌入式电子产品MP4研制的实践经验,介绍了汉字的主要编码方案,字库的定制以及如何从字库中获取字模并将其打印到屏幕上等技术,试总结提出一种嵌入式系统中通用灵活的字符显示方案. 相似文献

2.

基于UCGUI库的外扩中文字库研究与实现

李建红刘丹徐展《计算机工程》2014,(2):271-274,279

UCGUI是实时嵌入式系统中广泛使用的图形用户界面,但UCGUI不支持中文字符编解码。为此,提出一种支持中文字符编解码的方法。在分析UCGUI字符编解码框架基础上,修改内核代码,添加GB2312汉字编解码驱动,实现中文字符显示编解码服务。针对UCGUI中文显示时中文字库占用空间大与MCU存储空间有限的矛盾,提出一种字体驱动与字模数据分离的中文字体设计方法,包括为外扩字体设计专用驱动、字模数据存储接口及存储方法。在UCGUI仿真平台环境下的测试结果表明,该字库在UCGUI系列环境下,具有较好的可用性和通用性,可弥补UCGUI界面库在低成本嵌入式系统中难以实现中文显示的缺陷。相似文献

3.

面向稀疏卷积神经网络的GPU性能优化方法

董晓刘雷李晶冯晓兵《软件学报》2020,31(9):2944-2964

近些年来,深度卷积神经网络在多项任务中展现了惊人的能力,并已经被用在物体检测、自动驾驶和机器翻译等众多应用中.但这些模型往往参数规模庞大,并带来了沉重的计算负担.神经网络的模型剪枝技术能够识别并删除模型中对精度影响较小的参数,从而降低模型的参数数目和理论计算量,给模型的高效执行提供了机会.然而,剪枝后的稀疏模型却难以在GPU上实现高效执行,其性能甚至差于剪枝前的稠密模型,导致模型剪枝难以带来真正的执行性能收益.提出一种稀疏感知的代码生成方法,能够生成高效的稀疏卷积GPU程序.首先为卷积算子设计了算子模板,并结合GPU的特点对模板代码进行了多种优化.算子模板中的源代码经过编译和分析被转换为算子中间表示模板,设计了一种稀疏代码生成方法,能够结合剪枝后的稀疏参数,基于中间表示模板生成对应的稀疏卷积代码.同时,利用神经网络执行过程中的数据访问特点对数据的访问和放置进行了优化,有效提升了访存吞吐量.最后,稀疏参数的位置信息被隐式编码在生成的代码中,不需要额外的索引结构,降低了访存需求.在实验中证明了：相对于GPU上已有的稀疏神经网络执行方法,提出的稀疏感知的代码生成方法能够有效提升稀疏卷积神经网络的性能. 相似文献

4.

基于S3C44BOX与LCD模块的中英文字符显示

陈功文万军《计算机与现代化》2008,(4):108-111

针对不带字库的液晶显示模块的嵌入式系统,利用系统自身的ROM存储器,采用自制硬件字库的方法,实现汉字和英文字符在LCD上的混合显示。本文简要描述了图形点阵液晶模块LM2028的主要特性,给出了S3C44BOX与LM2028的接口电路,描述了利用FLASH ROM芯片生成硬件字库及提取字模的方法,最后介绍了中英文字符显示的程序实现。相似文献

5.

基于嵌入式GPU 虚拟仪表图形软件的实现

郭云康涛《计算机系统应用》2012,21(10):47-52

提出并实现了一种基于嵌入式GPU(OES:OpenGL?ES)的跨平台图形应用软件的系统框架.它包括外部事件的驱动,图形应用软件,嵌入式系统入口,嵌入式系统硬件等四个模块.外部事件的驱动主要是响应外部数据或事件的变化,从而控制图形显示内容的实时更新,以及功能画面的实时切换.图形应用软件模块包括了三个组成部分(1)接口界面(2)中间通讯层(3)处理单元.图形应用软件的接口界面主要是实现客户化的目标要求,采用C++类的面向对象的设计方法.中间通讯层,是为了实现图形应用的任务而安排的结构化的类.处理单元是各种最基本内容的单元实现,它建立在我们的各种实用库之上.嵌入式系统入口,它封装了图形软件的核心函数功能,实现和上层的处理单元间的数据调度.嵌入式系统硬件模块主要是各主流平台(CPU,GPU)相关的数据信息,支持上层的图形应用.本文在虚拟仪表盘面上实践了上述应用软件系统,满足了实时响应,高效处理,高质量图形显示的要求.为实现嵌入式平台的图形显示应用打下了重要的基础.同时,本文的工作提出并解决了若干嵌入式图形显示技术的优化问题,为嵌入式图形显示开发提供了有力的帮助. 相似文献

6.

基于变长码的面向字符文本处理方法

赵旭晟《中文信息学报》1997,11(4):53-60

传统的以字节为对象的文本处理方法在今天越来越显出它的弊端。本文提出的基于变长码的面向字符的文本处理方法, 在统一编码的基础上, 将逻辑字符与它的存储方式独立开来, 并以此为单位进行文本处理。这种方式可以有效地解决汉字等多字节字符集的编辑、显示、检索的不便, 还可使字符集的容量无限扩充。本文陈述了变长码的概念与面向字符的文本处理方法的基本思想, 并以汉字处理为例给出了几个层次的实现方法。相似文献

7.

监视屏幕字符叠加与显示

陆旭明《工业控制计算机》2011,24(10):101-102,105

监视画面被录像时,需要记录一些当时的信息,比如时间地点等,这些信息便于在视频播放时能被观众一目了然,尤其针对一些工控企业、金融系统而言,在监控画面进行查询时,希望能够直接通过画面的时间地点信息进行筛选播放.在每个摄像点进行时间或地点字符和视频叠加就显得具非常重要了.主要研究的是时间和视频叠加的设计,地点字符的和视频的叠... 相似文献

8.

面向多核CPU和GPU平台的数据库星形连接优化

刘专韩瑞琛张延松陈跃国张宇《计算机应用》2021,41(3):611-617

针对联机分析处理（OLAP）中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器（CPU）和图形处理器（GPU）上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache和GPU shared memory大小的向量划分来提出基于向量粒度的星形连接操作,从而优化星形连接中向量索引的物化代价;最后,提出了基于压缩向量的星形连接算法,将定长向量索引压缩为变长的二元向量索引,从而在低选择率时提高cache内向量索引的存储访问效率。实验结果表明,在CPU平台上向量化星形连接算法相对于常规的行式或列式连接性能提升了40%以上,在GPU平台上向量化星形连接算法相对于常规星形连接算法性能提升超过了15%;与当前主流的内存数据库和GPU数据库相比,优化的星形连接算法性能相对于最优内存数据库Hyper性能提升了130%,相对于最优的GPU数据库OmniSci性能提升了80%。可见基于向量索引的向量化星形连接优化技术有效地提高了多表连接性能,与传统优化技术相比,基于向量索引的向量化处理提高了较小cache上的数据存储访问效率,压缩向量进一步提升了向量索引在cache内的访问效率。相似文献

9.

面向多GPU的图神经网络训练加速

苗旭鹏王驭捷沈佳邵蓥侠崔斌《软件学报》2023,34(9):4407-4420

图神经网络由于其强大的表示能力和灵活性最近取得了广泛的关注. 随着图数据规模的增长和显存容量的限制, 基于传统的通用深度学习系统进行图神经网络训练已经难以满足要求, 无法充分发挥GPU设备的性能. 如何高效利用GPU硬件进行图神经网络的训练已经成为该领域重要的研究问题之一. 传统做法是基于稀疏矩阵乘法, 完成图神经网络中的计算过程, 当面对GPU显存容量限制时, 通过分布式矩阵乘法, 把计算任务分发到每个设备上, 这类方法的主要不足有: (1)稀疏矩阵乘法忽视了图数据本身的稀疏分布特性, 计算效率不高; (2)忽视了GPU本身的计算和访存特性, 无法充分利用GPU硬件. 为了提高训练效率, 现有一些研究通过图采样方法, 减少每轮迭代的计算带价和存储需求, 同时也可以支持灵活的分布式拓展, 但是由于采样随机性和方差, 它们往往会影响训练的模型精度. 为此, 提出了一套面向多GPU的高性能图神经网络训练框架, 为了保证模型精度, 基于全量图进行训练, 探索了不同的多GPU图神经网络切分方案, 研究了GPU上不同的图数据排布对图神经网络计算过程中GPU性能的影响, 并提出了稀疏块感知的GPU访存优化技术. 基于C++和CuDNN实现了该原型系统, 在4个不同的大规模GNN数据集上的实验表明: (1)通过图重排优化, 提高了GPU约40%的缓存命中率, 计算加速比可达2倍; (2)相比于现有系统DGL, 取得了5.8倍的整体加速比. 相似文献

10.

利用语料库技术的中文自动文摘系统 总被引：2，自引：0，他引：2

姜贤塔陈根才《中文信息学报》1999,13(2):17-24

本文着重介绍利用“后邻字符树”的方法在领域语料库中生成字符树库,用于自动文摘候选句子选取时提高精度,介绍了后邻字符树的构造、后邻字符树库的生成及优化和句子权值计算方法。相似文献

11.

稀疏表与块表结合的多租户共享存储模型

刘彬程凯于杰《计算机系统应用》2018,27(12):210-215

针对传统单稀疏表存储模型存储空间利用率低以及块表存储模型重构租户逻辑关系时连接次数多的问题,提出了稀疏表与块表结合的存储模型.该存储模型中将租户基于SaaS应用服务商提供的逻辑表上定制的属性及自定义的逻辑表中的属性映射到列数合适的稀疏表中存储,而将租户一部分常见数据类型的自定义的属性存储到块表中,以此避免因扩展字段的列数超过稀疏表列数导致的数据迁移问题,最后通过定义查询重写器给出了从租户逻辑SQL请求到物理SQL请求的转换.实验结果表明,该存储模型在存储空间利用率及查询效率上相比传统的稀疏表存储模型都有所提升. 相似文献

12.

基于C 的稀疏矩阵乘法运算器的实现

ZHOU Min 《电脑编程技巧与维护》2008,(14)

稀疏矩阵是指那些多数元素为零的矩阵。本文利用稀疏矩阵"稀疏"特点进行存储和计算可以大大节省存储空间,提高计算效率。通过采用标准C 语言设计实现了稀疏矩阵乘法运算器。相似文献

13.

基于C＋＋的稀疏矩阵乘法运算器的实现

周敏《电脑编程技巧与维护》2008,(11):19-19,42

稀疏矩阵是指那些多数元素为零的矩阵。本文利用稀疏矩阵“稀疏”特点进行存储和计算可以大大节省存储空间,提高计算效率。通过采用标准C＋＋语言设计实现了稀疏矩阵乘法运算器。相似文献

14.

Parallel Solutions for Large-Scale General Sparse Nonlinear Systems of Equations

下载免费PDF全文

HU Chengyi 《计算机科学技术学报》1996,11(3):257-271

In solving application problems,many large-scale nonlinear systems of equaions result in sparse Jacobian matrices.Such nonlinear systems are called sparse nonlinear systems.The irregularity of the locations of nonzrero elements of a general sparse matrix makes it very difficult to generally map sparse matrix computations to multiprocessors for parallel processing in a well balanced manner.To overcome this difficulty,we define a new storage scheme for general sparse matrices in this paper,With the new storage scheme,we develop parallel algorithms to solve large-scale general sparse systems of equations by interval Newton/Generalized bisection methods which reliably find all numerical solutions within a given domain.I n Section 1,we provide an introduction to the addressed problem and the interval Newton‘s methods.In Section 2,some currently used storage schemes for sparse systems are reviewed.In Section 3,new index schemes to store general sparse matrices are reported.In Section 4,we present a parallel algorithm to evaluate a general sparse Jacobian matrix.In Section 5,we present a parallel algorithm to solve the corresponding interval linear system by the all-row preconditioned scheme.Conclusions and future work are discussed in Section 6. 相似文献

15.

基于分块存储格式的稀疏线性系统求解优化

程凯田瑾吴飞汪茹李洪芹《计算机应用研究》2019,36(11)

针对基于GPU求解大规模稀疏线性方程组进行了研究,提出一种稀疏矩阵的分块存储格式HMEC（hybrid multiple ELL and CSR）。通过重排序优化系数矩阵的存储结构,将系数矩阵以一定的比例分块存储,采用ELL与CSR存储格式相结合的方式以适应不同的分块特征,分别使用适用于不对称矩阵的不完全LU分解预处理BICGStab法和对称正定矩阵的不完全Cholesky分解预处理共轭梯度法求解大规模稀疏线性系统。实验表明,应用HMEC格式存储稀疏矩阵并以调用GPU kernel的方式实现前述两种方法,与其他存储格式的实现方式作比较,最优可分别获得31.89%和17.50%的加速效果。相似文献

16.

多模式匹配算法的优化研究

方贤进李龙澍《微计算机信息》2007,23(9)

模式匹配技术有着广泛的应用且模式匹配算法已经被研究了很多年,同时对稀疏存储及其结构的操作也有大量的文献资料。本文首先描述了Aho-Corasick多模式匹配算法,该算法是基于自动机及状态向量的,然后提出了使用banded-row稀疏存储对Aho-Corasick算法中的状态转换表进行存储优化的观点,给出了优化算法。最后给出了和原Aho-Corasick算法相比较的测试结果,该结果表明在大模式集的情况下,使用banded-row稀疏存储的Aho-Corasick算法减少了存储需求,进一步地提高了性能。相似文献

17.

多模式匹配算法的优化研究

方贤进李龙澍《微计算机信息》2007,23(3X):211-213

模式匹配技术有着广泛的应用且模式匹配算法已经被研究了很多年，同时对稀疏存储及其结构的操作也有大量的文献资料。本文首先描述了Aho—Corasiek多模式匹配算法，该算法是基于自动机及状态向量的，然后提出了使用banded—row稀疏存储对Aho—Corasick算法中的状态转换表进行存储优化的观点，给出了优化算法。最后给出了和原Aho—Corasick算法相比较的测试结果，该结果表明在大模式集的情况下，使用banded—row稀疏存储的Aho—Corasick算法减少了存储需求，进一步地提高了性能。相似文献

18.

邻域表示的形状刚性操作实现方法

雷闻宇高博宇雷开彬《计算机工程与应用》2012,48(31):186-190

角色动画编辑的核心技术之一,是形状既能实现刚性变形,又能实现实时操作。在形状刚性操作计算中,通过定义三角网格顶点的面邻域和点邻域的平方差度量,简化自由顶点与约束顶点的坐标分离。这种表示法,在整体拟合中使得x坐标与y坐标能够独立求解。在算法实现中,设计恰当的系数矩阵和常数项向量的链表结构,采用矩阵索引存储和共轭梯度求解,减少数据的重复计算。实验表明,在普通的PC机上能够实现约1 000个顶点的网格实时交互变形操作。相似文献

19.

应用稀疏数组存储病案首页数据研究

黄锋《计算机应用与软件》2004,21(5):61-62,94

病历数据性质特殊，一般数据模型用于其管理比较困难，因此需要研究寻找适合的特殊数据模型。病案首页是病历的一种摘要，病历数据的许多特性均反映到病案首页中。本文将介绍一种应用稀疏数组存储病案首页的存储结构设计，以及基于稀疏数组的病案首页系统如何利用稀疏数组的特性，使存储结构既能保证长久数据的应用连续性，又能不断适应结构变化，同时介绍其独特的数据存储体系和数据备份方案。相似文献

20.

大型稀疏线性方程组符号LU分解法

张永杰孙秦《计算机工程与应用》2007,43(28):29-30

基于有限元总刚矩阵的大规模稀疏性、对称性等特性,采用全稀疏存储结构以及最小填入元算法,使得计算机的存储容量达到最少。为了节省计算机的运算时间,对总刚矩阵进行符号LU分解方法,大大减少了数值求解过程中的数据查询。这种全稀疏存储结构和符号LU分解相结合的求解方法,使大规模稀疏线性化方程组的求解效率大大提高。数值算例证明该算法在时间和存贮上都较为占优,可靠高效,能够应用于有限元线性方程组的求解。相似文献