首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
针对中文文本结构的特点以及传统压缩算法对中文文本压缩的不足,提出并实现了一个基于PDC编码的中文文本压缩算法。该算法采用的是字典压缩方式。根据单个汉字在中文文本出现的概率,采用Huffman编码方式进行前缀变长编码;定义由某个汉字为前缀的词组和短语的深度;对具有相同前缀和相同深度的词组和短语进行局部的定长编码,构成一部压缩编码字典。通过对相同文本分别使用该算法和传统的LZW和LZSS编码算法压缩后得到的数据结果对比,压缩率有2.53%~40.48%的提高,表明该压缩算法有较好的压缩效果。  相似文献   

2.
基于中文词编码的压缩算法ZHCP的实现   总被引:2,自引:0,他引:2  
本文提出并实现了一个基于词编码的ZHCP中文文本压缩算法,通过大量的对相同文本分别使用传统编码算法与ZHCP算法压缩后得到的结果数据对比,表明基于词编码的ZHCP压缩算法有较好的压缩效果。  相似文献   

3.
针对VxWorks自带压缩算法在内存受限系统下的缺陷,提出一种基于Huffman编码的VxWorks映像压缩算法;该算法利用VxWorks映像文件的格式,结合处理器指令集的特点,通过分段和分字节两种策略对VxWorks映像文件进行压缩;以SPARC V7指令集为例,对该算法测试压缩性能,实验结果表明,使用分段和分字节策略后的Huffman压缩率为67.6%,略高于VxWorks自带压缩算法,但占用内存仅为1.5kB,为VxWorks自带压缩算法的1/10。  相似文献   

4.
针对当前常用的XML压缩算法没有考虑中文特点的情况,结合中文与XML的特点,提出一种高压缩率的适合中文XML文档的压缩算法COX。利用中文分词技术对XML文档进行分词处理,通过统计词频后获得排序的词典,利用Huffman编码思想对高频及长词汇进行压缩编码;解析XML文档后,把文档元素进行分类,同一类型的元素放入同一容器之中;算法还特别针对数字类型的数据进行了特殊处理。实验结果显示,相对于通用的压缩软件,COX具有更好的压缩效果,但压缩和解压缩时间要慢一些。  相似文献   

5.
本文改进了Huffman编码算法,主要是针对Huffman编码生成Huffman树构造中的排序方法的改进,提出一种基于"堆排序"的新方法。采用堆排序找到最小值实现Huffman编码,经过这种改进的Huffman编码方法对内存读写的次数大为减少,从而提高了响应速度。使得Huffman编码效率有所提高。通过对JPEG的Huffman压缩算法的分析以及采用4个JPG文件对改进的和传统的Huffman算法进行了仿真实验,对比分析表明改进算法的性能无论是压缩比率还是压缩时间方面都比经典的Huffman算法性能有所提高。  相似文献   

6.
何志兰  崔杜武 《计算机工程》2005,31(21):176-178
电子词典西文只有26个大小写字母,而汉字成百上千,利用此数据特点提出分别对中文和西文采用不同的压缩算法,此算法是对传统电子词典采用Huffman编码,将中文和西文不加区分混合进行压缩编码,对所存在缺陷进行改进。使电子词典的压缩率和压缩速度大大提高,同时在保证压缩率相等的情况下,使编码均匀分布减少预分配内存空间和增强抗误码的能力。最后通过实例比较了两种压缩的效率,说明新压缩方案的正确性和可行性。  相似文献   

7.
一种最优化链码指纹二值细化图像压缩编码   总被引:1,自引:1,他引:0  
李超  杜赓  杨义先  钮心忻 《计算机应用》2006,26(10):2357-2359
提出了一种适合于对线状结构的条形纹线二值图像进行压缩的最优化Freeman链码压缩算法——Freeman差分链码Huffman编码。与传统的Freeman链码相比,提出的压缩算法是基于Freeman链码、差分编码和Huffman编码的一种混和编码方式。通过理论分析和在指纹二值细化图上的实验结果证明,对于指纹二值细化图像,本算法优于现有的链码压缩二值图像的算法,针对于线状结构的条形纹线二值图像,本算法也优于其他压缩算法。其平均码长为1.7651bits,低于8方向Freeman链码或者Freeman差分链码的3bits的平均码长。  相似文献   

8.
戴祖旭  洪帆  董洁 《计算机工程》2007,33(15):147-148
自然语言句子可以变换为词性标记串或句型。该文提出了基于句型Huffman编码的信息隐藏算法,根据句型分布构造Huffman编码,秘密信息解码为句型。句型在载体文本中的位置是密钥,对句型作Huffman压缩编码即可提取秘密信息,给出了信息隐藏容量公式。该算法不需要修改载体文本。  相似文献   

9.
张丽霞  宋鸿陟 《计算机应用》2010,30(5):1379-1382
根据DNA序列数据的特点,提出对DNA序列数据进行多重压缩的思想。多重压缩的首要步骤是扩展字母表。首先对DNA序列数据进行0/1编码,然后每8位转换成一个ASCII码字符,将原来的DNA序列数据仅含有的4个字符扩展到256个字符。第二步采取基于统计模型的Huffman编码压缩算法和基于转换模型的Burrows-Wheeler算法,对扩展后的DNA序列数据进行二次压缩。最后对各种算法的压缩结果进行性能分析比较,比较结果显示,多重压缩算法有较优的压缩比。  相似文献   

10.
本文提出了一种新的图象压缩编码方法。该方法具有以下特点:(1)以游程长度编码,各码码长相等,均为8bit;(3)码字覆盖的最大游程长度为2048;(3)由于按字节存取,编码解码很方便;(4)特别适合于文本图象的编码压缩,对一般的文本图象压缩比为1∶8;(5)通讯中遇到干扰时可恢复图象,亦即比 Huffman 编码有很强的抗干扰性能,与 Huffman 编码的压缩比大约为1∶0.8;这种编码方法具有一定的实用价值。本文的压缩编码方法为无失真编码。  相似文献   

11.
结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR。  相似文献   

12.
基于MD5与Base64的混合加密算法   总被引:1,自引:0,他引:1  
罗江华 《计算机应用》2012,32(Z1):47-49
介绍了一种基于MD5和Base64的混合加密算法,首先将明文MD5加密得到32位16进制密文,再将32位密文拆分成16个2位16进制数组,并转换成对应的二进制数,最后将16个二进制数组连接成一个128位的2进制数,采用Base64加密原理进行加密.该算法可以避免查询MD5散列值字典获取用户明文密码,更加有效地保证了用户的密码安全,最后给出了算法的PHP实现.  相似文献   

13.
The Data Encryption Standard (DES) or Data Encryption Algorithm (DEA), ANSI standard X3.92-1981, is a well known symmetric block cipher. In the basic mode of operation, electronic code book mode, it encrypts blocks of 64 bits of plain text into 64 bits of cipher text using a 56-bit key. Its internal structure, which is highly non-linear and contains 18 permutations and 16 expansions of bit blocks, does not encourage software implementation but is much better suited for hardware implementation. However, by a series of equivalence transformations, all expansions and but two of the permutations can be eliminated. Furthermore, then the 16-bit or 32-bit architecture of modern microprocessors can be fully exploited. Both a 16-bit version of the transformed algorithm (for 8086 and 80286) and a 32-bit version (for 80386 and 80486) have been implemented in assembly language. Depending on the actual processor employed, the implementation chooses 16-bit code or 32-bit code at run time. A sustained throughput of over 75,000 bytes second on a 33-MHz 80386 with cache and of over 8800 bytes per second on a 10-MHz 80286 with one wait state is obtained. The program needs only 13·3 kbytes for code and data. Hence this high-performance software DES implementation is also well suited for embedded applications, as for instance for encryption of serial communication lines or ISDN voice and data channels.  相似文献   

14.
卢毓海  沈燕飞  王春洁  朱珍民 《计算机工程》2012,38(21):221-225,236
针对计算机桌面图像压缩问题,提出一种基于颜色聚类的图像压缩算法。将桌面图像划分成16×16的非重叠块,归为文本/图形块、自然图像块及混合块3类。对色彩丰富文本/图形块进行颜色聚类,以降低块的颜色种类数,并做无损压缩。对自然图像块采用H.264帧内预测编码方法,对混合块采用混合编码方法。实验结果表明,该算法所得图像的峰值信噪比和结构相似度均高于传统算法。  相似文献   

15.
在64位体系结构的CPU中,字长从32位扩展到64位,处理器每次可以处理的数据也增加到64位。这对搜索引擎使用的核心数据结构——倒排索引的压缩与解压缩带来一定的影响。针对当前32位整数字对齐压缩算法Simple不适用于64位系统的问题,对其进行改进,并提出3种基于64位的字对齐压缩算法,即SimpleX64-16、SimpleX64-32和SimpleX64-64。3种算法都采用多种压缩模式,并对每个模式进行压缩空间的优化。在64位机器上GOV2和ClueWeb09B数据集的倒排索引实验结果表明,与传统的基于32位字对齐的压缩算法相比,3种基于64位字对齐的算法在解压速度方面最多提高14.5%,在压缩率方面最多提高2.5%。  相似文献   

16.
编码超声可以在不增加发射能量的前提下提高平均发射声功率,进而有效提高微小目标体的检出率,增加检测深度,提高目标体成像分辨率。而稀疏采样技术可以有效减少采集数据量,提高检测算法实时性。将二者的优点结合,在高频、超宽带以及多传感器超声阵列实时检测与成像领域有重要研究价值。为此,提出了一种编码超声有限新息率稀疏采样方法,该方法在建立编码超声信号稀疏采样构架的基础上,通过脉冲压缩技术实现编码超声信号的时域压缩,并通过仿真实验对3位二进制编码超声信号进行了稀疏采样与参数重构。仿真结果表明,该方法可实现编码超声信号的稀疏采样,在减少数据量的同时准确重构出原信号。  相似文献   

17.
在文本压缩中联合使用LZSS和LZW   总被引:3,自引:0,他引:3  
本文分析了LZ77和LZ78算法在文本压缩中各自的长处和不足,以它们的实用算法LZSS和LZW的中文文本改进算法LZSSCH和LZWCH为基础,设计了联合使用LZ77和LZ78原理的LZSWCH算法。算法具有良好的通用性、实时性,对9个各种长度的样本文本文件取得的压缩比均高于LZSS和LZW,高出幅度分别达到6~19%。算法无须任何预处理,并可用于压缩其它文字的文本文件。  相似文献   

18.
基于邻接矩阵全文索引模型的文本压缩技术   总被引:1,自引:0,他引:1  
基于不定长单词的压缩模型的压缩效率高于基于字符的压缩模型,但是它的最优符号集的寻找算法是NP完全问题,本文提出了一种基于贪心算法的计算最小汉字平均熵的方法,发现一个局部最优的单词表。这种方法的关键是将文本的邻接矩阵索引作为统计基础,邻接矩阵全文索引是论文提出的一种新的全文索引模型,它忠实地反映了原始文本,很利于进行原始文本的初步统计,因此算法效率得以提高,其时间复杂度与文本的汉字种数成线性关系,能够适应在线需要。并且,算法生成的压缩模型的压缩比是0.47,比基于字的压缩模型的压缩效率提高25%。  相似文献   

19.
DICOM图像文件的储存和传输一直是近代医学图像处理中一个比较热门的研究话题,其中较好的解决方案就是对DICOM图像进行压缩处理。文中通过对DICOM文件的数据结构进行分析,将DICOM文件拆分成图像数据部分和文本信息部分,然后采用9/7提升小波变换对拆分出来的DICOM图像数据进行图像变换,最后对变换后的小波系数进行SPIHT编码完成DICOM图像压缩。主客观对图像的评价表明SPIHT算法在高压缩比时仍能保证图像较好的质量。该方法能够对DICOM图像的存储和传输带来便利也将产生一定的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号