排序方式: 共有4条查询结果,搜索用时 15 毫秒
1
1.
在PDF的各种应用中,对于文档的理解与处理是非常重要的.首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档.因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出来,经过组织后,保存在称为KIU的文件中,这样可以在实际上不接触PDF文件的情况下,自动生成超链接.分区域的方法有利于提取过程,找到文本的位置和范围后,可以借助于光学字符识别(OCR)软件来提取文本中的关键性词语或词组. 相似文献
2.
3.
喷泉编码是一种新颖的编码技术,核心算法使用简单的同位及线性方程式,编译码只需要很低的处理功能,随着其学术理论的日益完善,获得了越来越多的应用;文章介绍了喷泉编码的基本概念和特点,详细地分析了LT码的编译码过程,介绍了两种良好的度分布函数,并对度分布函数的优缺点进行了讨论,最后简述了喷泉编码的应用前景。 相似文献
4.
对PDF文档的处理常常要涉及到文本和图像的提取。文章在深入分析PDF格式和其中采用的各种压缩算法的基础上,实现了PDF文档中JPEG图像的自动提取。算法结合PDF文档结构和页面树,按照图像在页面中出现的顺序,对各页面中含有的图像对象进行准确定位,依次提取其中的图像压缩数据,并根据采用压缩算法的不同,对压缩数据进行筛选,最后得到保存为JPEG格式的图像。算法可以很好地应用于由任何途径生成的各种类型的PDF文档。 相似文献
1