共查询到18条相似文献,搜索用时 62 毫秒
1.
PDF文档在Web上出版技术研究 总被引:2,自引:0,他引:2
本文详细讨论了PDF文档的特点,并对Web服务器对PDE文档的支撑环境PDF文档与应用等方面进行探讨.最后通过实例给出应用ASP技术实现PDF与eb数据库集成的过程.该项技术对PDF的网络出版、电子商务票据生成有很好的应用前景. 相似文献
2.
基于XML的PDF文档内容与结构的表示的实现 总被引:2,自引:0,他引:2
在对网络信息资源进行检索、过滤、提取的过程中,对于文档格式的转换是进行信息处理的必然途径。将PDF文档转换为XML文档,在对分析PDF文档的内容和结构方面具有重要意义。论文介绍了从PDF文档向XML文档转换的设计和实现原理。 相似文献
3.
4.
《电脑爱好者:普及版》2009,(1):60-60
PDF格式的文档是一种流传很普遍的文件格式,有的文档中多数是文字,而另有一些文档中还含有许多非常珍贵的图片。如果你对其中的图片已经垂涎三尺了,那么如何将它们据为己有呢?如果直接截图,一个接一个地打开再截图,很麻烦。这时,你也许在想——如果不打开PDF文件就能把图抠出来就好了,如果还能精确到某个图片就更好了!现在,你的梦想可以变成现实了——pDFImageExtractionWizard3.0这款软件可以帮你实现梦想。 相似文献
5.
6.
7.
8.
很多制作精良的PDF文档都会在其页面上提供多种交互特性,这样做一方面是为了增加页面的趣味性。而更为重要的是,它可以增强PDF文档的视觉吸引力,提供补充信息并增强文档的交互能力,从而带来演示和阅读的方便。本文将详细介绍如何批量快速地为PDF文挡添加交互功能。 相似文献
9.
通过恶意文档来传播恶意软件在现代互联网中是非常普遍的,这也是众多机构面临的最高风险之一。PDF文档是全世界应用最广泛的文档类型,因此由其引发的攻击数不胜数。使用机器学习方法对恶意文档进行检测是流行且有效的途径,在面对攻击者精心设计的样本时,机器学习分类器的鲁棒性有可能暴露一定的问题。在计算机视觉领域中,对抗性学习已经在许多场景下被证明是一种有效的提升分类器鲁棒性的方法。对于恶意文档检测而言,我们仍然缺少一种用于针对各种攻击场景生成对抗样本的综合性方法。在本文中,我们介绍了PDF文件格式的基础知识,以及有效的恶意PDF文档检测器和对抗样本生成技术。我们提出了一种恶意文档检测领域的对抗性学习模型来生成对抗样本,并使用生成的对抗样本研究了多检测器假设场景的检测效果(及逃避有效性)。该模型的关键操作为关联特征提取和特征修改,其中关联特征提取用于找到不同特征空间之间的关联,特征修改用于维持样本的稳定性。最后攻击算法利用基于动量迭代梯度的思想来提高生成对抗样本的成功率和效率。我们结合一些具有信服力的数据集,严格设置了实验环境和指标,之后进行了对抗样本攻击和鲁棒性提升测试。实验结果证明,该模型可以保持较高的对抗样本生成率和攻击成功率。此外,该模型可以应用于其他恶意软件检测器,并有助于检测器鲁棒性的优化。 相似文献
10.
类型系统是研究面向对象技术形式理论基础的重要工具 类型系统λω×≤ 是一个带高阶子类型关系的多态类型系统 ,对其性质和范畴论语义模型进行了研究 在此基础上 ,讨论了如何以类型系统λω× ≤ 为工具 ,研究对象、类、继承等面向对象技术的基本概念的形式语义 结合类POINT和CPOINT等例子 ,讨论了基于递归类型和基于存在类型的两种对象表示方法 ,并对它们的特点进行了总结与比较 相似文献
11.
12.
针对传统静态检测及动态检测方法无法应对基于大量混淆及未知技术的PDF文档攻击的缺陷,提出了一个基于系统调用和数据溯源技术的新型检测模型NtProvenancer。首先,使用系统调用捕获工具收集文档执行时产生的系统调用记录;其次,利用数据溯源技术构建基于系统调用的数据溯源图;而后,用图的路径筛选算法提取系统调用特征片段进行检测。实验数据集由528个良性PDF文档与320个恶意PDF文档组成。在Adobe Reader上展开测试,并使用词频-逆文档频率(TF-IDF)及PROVDETECTOR稀有度算法替换所提出的图的关键点算法来进行对比实验。结果表明NtProvenancer在精确率和F1分数等多项指标上均优于对比模型。在最佳参数设置下,所提模型的文档训练与检测阶段的平均用时分别为251.51 ms以及60.55 ms,同时误报率低于5.22%,F1分数达到0.989。可见NtProvenancer是一种高效实用的PDF文档检测模型。 相似文献
13.
由于文档图像的布局复杂、目标对象尺寸分布不均匀,现有的检测算法很少考虑多模态信息和全局依赖关系,提出了基于视觉和文本的多模态文档图像目标检测方法。首先探索多模态特征的融合策略,为利用文本特征,将图像中文本序列信息转换为二维表征,在文本特征和视觉特征初次融合之后,将其输入到骨干网络提取多尺度特征,并在提取过程中多次融入文本特征实现多模态特征的深度融合;为保证小物体和大物体的检测精度,设计了一个金字塔网络,该网络的横向连接将上采样的特征图与自下而上生成的特征图在通道上连接,实现高层语义信息和低层特征信息的传播。在大型公开数据集PubLayNet上的实验结果表明,该方法的检测精度为95.86%,与其他检测方法相比有更高的准确率。该方法不仅实现了多模态特征的深度融合,还丰富了融合的多模态特征信息,具有良好的检测性能。 相似文献
14.
为了提高科技文档中几何作图的效率,在科技文档字处理软件ScienceWord中实现了一种基于约束的平面几何作图系统.为了构建基于约束的作图系统,对约束的相关理论作了研究,讨论了该作图系统的总体设计框架和构建约束作图系统的一般步骤,介绍了系统中建立元素之间约束的用户界面设计.由于系统充分考虑了图形元素之间的几何关系,用户不必求助于别的软件就能在科技文档中高效地绘制出各种复杂的几何图形. 相似文献
15.
目前流行的数字文档格式很多,各有优缺点,文章主要对DJVU格式与PDF格式技术原理及各自优势进行了简单介绍,对两种格式的优缺点进行了剖析,针对不同情况下使用何种格式给出了建设性意见。 相似文献
16.
以数据导入单元的设计为例,阐述了电子文件归档管理系统核心功能单元的设计思路。主要从建立功能单元工作流程和确定逻辑操作及逻辑处理出发,就对象模型建立、类定义与类间关系、操作功能逻辑实现以及单元功能测试等方面进行了论述。 相似文献
17.
18.
PDF文件链接信息提取与修改 总被引:2,自引:0,他引:2
主要介绍了航空规章采用PDF文件格式,使用了书签、链接功能;利用AdobeAcrobat提供的编程接口编写Plug-in插件,实现了文件内和文件间的链接信息自动生成技术。 相似文献