首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
本文分析了各种文档处理系统特点,指出了文档处理系统的研究和发展趋向。文章叙述了作者研制的DPS的文档处理系统的设计和实施,该系统支持用户编辑文字图形图象综合的复杂文档。并且,文章提出了一个新的形式化的编辑命令语言,用该语言可定义文档的结构。  相似文献   

2.
本文主要介绍了TextPorter工具软件具有对多种格式,多种语言的电子文档的文本内容进行浏览和编辑的功能,分别阐述编辑器的文本的浏览、文字串的查找和替换,文字输入等功能对多语言的支持特性,说明了TextPorter在采用16位UNIXCODE内码的基础上,实现了对多语言的灵活的支持的性能。  相似文献   

3.
帅小应 《电脑》2001,(2):62-63
文本框是一种大小可调的文本或图形容器。在该框内可以放置多种对象,如文字、表格、图表、图形;在文本框四周可以排列其它对象或文字;用文本框向图形对象添加文字;文本框也可用于在页面上放置多块文本及为文本设置不同于文档中其他文本的方向。  相似文献   

4.
袁灏  徐丹 《微机发展》2003,13(11):6-8
在分析WindowsAPI多文档界面(MDI)环境机制的基础上,介绍支持多文档界面的应用程序的组成结构,并利用WindowsAPI预定义的文本编辑标准控件(edit类)开发一个支持多文档界面的文本编辑器,从而实现了在一个编辑器程序实例中同时编辑不同的文本。文中给出了具体的编程方法和相关程序代码。通过该编程示例展示出开发支持多文档界面的Windows应用程序的基本编程规范。  相似文献   

5.
在分析Windows API 多文档界面( MDI )环境机制的基础上,介绍支持多文档界面的应用程序的组成结构,并利用Windows API预定义的文本编辑标准控件(edit 类) 开发一个支持多文档界面的文本编辑器,从而实现了在一个编辑器程序实例中同时编辑不同的文本.文中给出了具体的编程方法和相关程序代码.通过该编程示例展示出开发支持多文档界面的 Windows 应用程序的基本编程规范.  相似文献   

6.
传统的话题模型假设每个文档只属于一个话题,而实际情况下一个文档往往与多个话题相关。应用LDA 模型将文档表示为多个话题的组合,并基于语言模型框架,提出了一种基于 LDA 的混合模型用于文本信息的 Ad hoc 检索。该方法将 LDA 模型与文档模型相结合,与聚类模型相比,在保持较低的计算复杂度外,具有很高的检索性能,因此更适用于大规模文档集的信息检索。  相似文献   

7.
付兵 《福建电脑》2007,(8):115-115,103
格式化文本中嵌入秘密数字水印可用于文本文档的保护.本文提出了一种新的基于格式化文本的空格编码水印算法.通过在Word文档中利用VBA编程实验了该算法,验证了这一数字水印方法的可行、稳定可靠且具有较好的隐蔽性.  相似文献   

8.
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。  相似文献   

9.
为了提高文本情感分类准确率,提出基于多约简Fisher向量空间模型和支持向量机的文本情感分类算法。该算法首先采用Fisher判别准则提取TF-IDF特征向量,然后依据低维文档向量空间模型间的相似度对文档进行聚类,减少文档的数目。该算法从维度和数量两个方面对文档的向量空间模型进行约简,以期提高支持向量机的训练速度和分类性能。仿真实验结果表明,该算法具有良好的召回率和分类准确率。  相似文献   

10.
文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高.  相似文献   

11.
12.
Automatic document processing: A survey   总被引:8,自引:0,他引:8  
  相似文献   

13.
国际化文字处理综述   总被引:3,自引:0,他引:3  
计算机与不同用户的交互通常必须实现通过多种文字信息的输入/输出以实现,因此操作系统对多种文字的支持程度是其功能性的一个衡量标准。各种文字特征的巨大差异导致现代操作系统的文字处理实现非常复杂。本文总结了操作系统文字处理的范围与内容,包括文本输入与存储,文本处理以及用户交互处理;归纳了通用的文字处理模型和可能采取的技术途径及其优缺点;分析了常用操作系统的文字处理实现;最后展望了文字处理仍面临的挑战。  相似文献   

14.
This paper describes our approach to the problem of specifying formatting information in computer-based text processing. We distinguish between local and global formatting decisions, adopt natural conventions for representing each, and separate them. Our system, cast as a preprocessor to an available formatter, hides annoying formatter dependencies, and leads to a document representation which can be processed under several operating systems. After initially implementing our system, we produced a second version for another formatter/operating system in less than 2 man-weeks.  相似文献   

15.
16.
General-purpose text editors have significant drawbacks when used for document preparation. This paper describes a system designed to combine the editing and formatting power of a text editor with the simplicity and immediacy of a typewriter for document preparation. The system is implemented on a minicomputer with a simple alphanumeric visual display unit.  相似文献   

17.
Fast access to information in different languages is still a major problem for many organizations. We have built a multilingual analyst's workstation integrated in the Tipster document management toolkit. The analyst workstation offers to an English-speaking analyst a variety of tools to browse sets of documents in Arabic, Japanese, Spanish and Russian, including a Unicode-based multilingual editor, and a simple machine translation functionality.The Temple project has developed an open multilingual architecture and software support for rapid development of extensible machine translation functionalities. The targeted languages are those for which natural language processing and human resources are scarce or difficult to obtain. The goal is to support rapid development of machine translation functionalities in a very short time with limited resources.Glossary-based machine-translation (GBMT) is used to provide an English gloss of a foreign document. A GBMT system uses a bilingual phrasal dictionary (glossary) to produce a phrase-by-phrase translation. Translation (based on phrase pattern-matching) is fast and accurate regarding the content of the document and browsed documents can be translated almost in real-time. A GBMT system for a language pair is also extremely simple, cheap and fast to develop. Moreover, all language resources used by the system are entirely under the control of the user.  相似文献   

18.
This paper proposes a method to compare document images in multilingual corpus, which is composed of character segmentation, feature extraction and similarity measure. In character segmentation, a top-down strategy is used. We apply projection and self-adaptive threshold to analyze the layout and then segment the text line by horizontal projection. Then, English, Chinese and Japanese are recognized by different methods based on the distribution and ratios of text line. Finally, character segmentation with different languages is done using different strategies. In feature extraction and similarity measure, four features are given for coarse measurement, and then a template is set up. Based on the templates, a fast template matching method based on coarse-to-fine strategy and bit memory is presented for precise matching. The experimental results demonstrate that our method can handle multilingual document images of different resolutions and font sizes with high precision and speed.  相似文献   

19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号