首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
2.
PDF文件转换攻略   总被引:1,自引:0,他引:1  
唐章蔚 《微电脑世界》2003,(4):87-87,88
很久以前,PDF格式文件就已经出现在我们的日常工作中,但由于某些方面的因素,这一极具优势的格式一直没能获得大规模的应用。在经历了一段时间的沉寂这后,随着互联网技术的发展以及以内联网为代表的网络环境的完善,再加上其制造者Adobe公司的大力推广,PDF格式已经成为在Internet上进行跨平台传输最通用的文件格式。  相似文献   

3.
4.
5.
在PDF的各种应用中,对于文档的理解与处理是非常重要的.首先要从文档中提取相关的关键词和短语,以便于在文档内部或外部建立超链接,方便建立电子文档.因此提出了一种新的方法,将关键信息(关键性的单词、词组或区域)从PDF文件中提取出来,经过组织后,保存在称为KIU的文件中,这样可以在实际上不接触PDF文件的情况下,自动生成超链接.分区域的方法有利于提取过程,找到文本的位置和范围后,可以借助于光学字符识别(OCR)软件来提取文本中的关键性词语或词组.  相似文献   

6.
笔者最近因为写论文,从网上下载了很多PDF格式的英文文献。这些文章下载下来后,却有很多无法使用金山词霸取词。笔者仅过一番研究,终于找到了彻底的解决办法。怎么,你也遇到了这个问题?跟我来吧,it's too simple! 未加密的PDF文件 PDF格式是Adobe公司的专利,可以保存不同级别的加密信息。一般情况下,如果PDF文件没有加密,那么只要注  相似文献   

7.
《数码时代》2009,(1):129-129
很多时候用户喜欢在浏览器内直接打开附件文档,而不愿意下载下来观看,之前这对于PDF文档来说是不可能的。但Gmail用户会发现,如果你收到的附件是PDF文件,那么在其后也提供了“查看”选项供选择。  相似文献   

8.
为有效提取PDF(portable document format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能扩展、显示4个单元的PDF阅读器的实现模型.基于PDF文件结构特点,提出了忽略次要信息定位关键位置的解析思路.在此基础上,针对FlatcDecode、DCTDecode和CCITTFFaxDecode这3种过滤器处理的数据流,给出了详细的解决方案,然后对PDF页面内容进行两次解析,设计相应的文字图形等数据结构保存结果,最后对数据利用和功能扩展进行了讨论.通过实验结果表明,该模型能较好地实现PDF信息提取和显示,有利于PDF在中文信息处理领域中的进一步开发利用.  相似文献   

9.
分析了各个版本XBASE数据库文件和图像文件的结构,提出了XBASE数据库图像信息自动导出转换的处理方法,提高了数据库转换工作的效率,解决了无法转换XBASE备注文件中的图像数据,文中还对实际应用中部分环节进行了注意事项说明,该方法具有很强的可操作性和实用性。  相似文献   

10.
一、引言结构化的文档格式Portable Document Format(PDF),由美国排版与图像处理软件公司Adobe于1993年首次提出,它是Adobe继页面描述语言PS(PostScript)之后,推出的最重要的电子文件规范,被广泛地应用于电子文件传送、交换和发行。由于其“高保真”的特性,已成为事实上的国际标准,目前流行的电子出版物基本上都是PDF格式的。 PDF从PS而来,具有与PS语言几乎相同的页面描述能力和相似的描述方法,但与PS语言不同的是,PDF除了能描述复杂版面外,还具有交互功能(如超链接、交互表单等)、页面随机存取及字体仿真描述等特性。 PS语言可以生成高质量的图文印刷输出,已成为工业标准并在当前印刷领域占统治地位。因此,利用PDF文件生成PS文件从而得到高质量的印刷输出,具有重要的意义。  相似文献   

11.
PDF文件信息的抽取与分析   总被引:5,自引:0,他引:5  
李珍  田学东 《计算机应用》2003,23(12):145-147
PDF文件网络信息抽取的重要资源。通过对PDF文件结构的分析,针对最流行的线性PDF文件,在论述如何从源代码中取出正文内容字符串流并进行解码的基础上,对从解码后的字符串流中提取出文本及其相关的字体、字号和换行等文本信息进行了详细的讨论。这将有助于根据需要进一步抽取PDF文件信息。  相似文献   

12.
用Plug-in实现对PDF文件的信息提取   总被引:6,自引:0,他引:6  
利用Adobe Acrobat提供的编程接口编写Plug-in插件,实现对PDF文件信息的提取。  相似文献   

13.
PDF文件链接信息提取与修改   总被引:2,自引:0,他引:2  
顾兆军  张俊 《计算机工程》2005,31(Z1):187-188
主要介绍了航空规章采用PDF文件格式,使用了书签、链接功能;利用AdobeAcrobat提供的编程接口编写Plug-in插件,实现了文件内和文件间的链接信息自动生成技术。  相似文献   

14.
龙珑  邓伟  覃晓 《微机发展》2014,(1):204-207
随着信息技术迅猛发展,很多不良信息与文化通过PDF文档传播,而传统的提取PDF内容的方法无法适应绿色网络提供优质内容并过滤不良PDF的社会需求。文中提出通过建立层次关键字自动机快速提取PDF内容并过滤不良PDF内容的方法。在提取准确性基本相同的情况下,文中方法提升了绿色网络系统提取PDF文档的速度,所用的时间仅为PDFBox方法的16%-36%,并能提供更好地过滤不良PDF的服务。  相似文献   

15.
PDF及其在电子出版领域的应用   总被引:15,自引:0,他引:15  
本文论述了PDF的特点、结构、产生方法以及它在电子出版领域应用。着重将PDF与PS和HTML进行了比较。详细地解析了PDF的结构,并阐述了目前生成PDF的方法。最后就采用PDF进行电子出版的步骤与方式进行了探讨,并进一步展望了PDF的应用前景。  相似文献   

16.
林威扬 《现代计算机》2010,(7):109-110,129
为了弥补现有的一页放置两个PDF的双面打印的携带及阅读不方便的不足,设计一种将PDF格式文档的页码顺序排列为适合打印成小册子的工具软件.该工具软件能将电脑中的PDF文档以一种排序方式重新排列页码.使得相同方式打印出来的页面在切割后可以装订为小册子。  相似文献   

17.
将Word文档自动转换成PDF格式的编程实现   总被引:1,自引:0,他引:1  
在日常工作中,人们普遍使用微软Word编辑器制作文本文档,而PDF格式文档以其平台独立性和安全性等特点备受文档管理和发布者青睐。本文介绍Word文档到PDF文档转换的手工操作方法,同时详细论述编制转换组件,建立不同应用环境下的应用程序的过程,实现MS Word格式文档向PDF格式文档的自动、批量转换。  相似文献   

18.
一种基于PDF文档的数字水印算法   总被引:6,自引:0,他引:6  
针对网络环境中对多媒体文本文档的篡改、盗版严重的问题,通过分析PDF文档的页面操作符以及具体参数的详细分析,提出并实现了一种基于PDF文档的数字水印算法.将水印信息添加到PDF(Portable Document Format)文档中文本字符码的特征信息中,通过检测从PDF文档中提取的水印信息与字符码的一致性来辨别该文档的真实性.试验结果表明,该算法具有很好的视觉透明性,而且便于出错信息的定位,是一种切实可行的数字水印算法.  相似文献   

19.
复杂背景下PDF417条码定位研究   总被引:1,自引:1,他引:1       下载免费PDF全文
PDF417作为一种广泛应用的二维条码,其检测定位成为条码识别过程中的关键,而复杂背景下条码的定位技术目前还不够完善。本文针对这一问题进行了研究,提出了一种基于数学形态学运算和Canny边缘检测的定位算法,并在此基础上作区域精确化处理,实现了条码的准确定位。实验结果表明,该方法能够有效提取出各种低对比度、边缘模糊、倾斜、商标干扰等复杂背景下的条码图像。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号