共查询到19条相似文献,搜索用时 150 毫秒
1.
2.
蒙古文是一种复杂文字,目前操作系统和办公套件都还不支持蒙古文的显示。OpenOffice.org是可以运行在Linux和Windows上跨平台的办公套件,它分别使用ICU LayoutEngine和Uniscribe进行复杂文字处理。本文以支持蒙古文处理的Linux版本OpenOiffice.org为基础,详细分析了OpenOffice.org在Linux和Windows系统上的复杂文本处理过程,采用Uniscribe与ICU相结合的方案,实现了OpenOffice.org在Windows平台上对蒙古文的显示。 相似文献
3.
根据图像中文字与背景区域的形态特征,提出了一种基于形态运算和连通元分析的复杂背景图像文字分割算法.实验结果表明,即使在图像分辨率不高以及文字布局较复杂的情况下,该算法仍然较快较准确地定位和分割出复杂背景图像中的文字. 相似文献
4.
五言绝句是我们传统文学的宝藏,给人独特的语言美感和审美体验.使用机器生成绝句诗歌对机器理解人类语言有着积极的探索意义.依据诗歌语言自身韵律和对仗特点,我们在诗歌数据集和对联数据集上联合训练诗歌生成模型.模型包括语义模型和文字规则模型,语义模型创新性地使用一维卷积网络提取诗歌文字的语义特征,学习诗歌语义的主题信息.文字规则模型使用带注意力机制的编码解码器,学习诗歌文字的对仗特征.实验结果表明模型可以很好地生成符合诗歌规则,表现诗人情感的诗句,如“感时花溅泪,愁路竹林心.秋风草树色,夜雨寒风声.” 相似文献
5.
本文针对复杂背景图像中文字与背景区域的形态特征,提出了一种基于形态运算和区域生长的快速文字分割算法MOSA,同时将之与LLT分割算法进行了比较。实验结果表明,该算法能较快和较准确地定位复杂背景图像中的文字区域,并且相对于LLT算法,该算法在速度与分割效果方面都有所提高。 相似文献
6.
基于蚁群优化算法的复杂背景图像文字检测方法 总被引:2,自引:0,他引:2
针对复杂背景图像中的文字检测问题,提出一种基于蚁群优化算法的复杂背景图像文字检测方法。该方法首先采用蚁群优化算法提取图像边缘;然后在边缘图像上提取特征,采取由粗到精多级检测、验证的策略进行文字检测。与基于Soble算子、Canny算子等方法的对比实验结果表明,所提出的基于蚁群优化算法的文字检测方法可有效地实现复杂背景图像中的文字检测。 相似文献
7.
介绍一种基于开源计算机视觉库(OpenCV)、训练模型(Seq2Seq)及Python语言实现的实时图像文字翻译技术。先使用OpenCV对摄像头画面进行捕获,再进行预处理、腐蚀、降噪、文字处理识别,代入Seq2Seq模型中,实现中英文字的翻译。 相似文献
8.
9.
电商图像背景较为复杂、文字区域形状多变,现有的文字检测模型无法精确检测文字位置这一问题。提出一种改进的文字检测模型——迭代自选择特征融合DBNet(iSFF-DBNet)。首先在主干网络提取特征后,在构建特征金字塔网络FPN的过程中引入注意力机制;然后提出了迭代自选择特征融合模块iSFF来提升模型的特征提取能力;最后引入双边上采样模块提升可微分二值化模块的自适应性能。实验结果表明,在ICPR MTWI 2018网络图像数据集文本检测任务中,对比标准的DBNet模型,所提改进模型的召回率和F-score分别提升了6.0%和2.4%。与其他文字检测模型相比,该模型在精确率和召回率上取得了平衡,能够更准确地检测文字。 相似文献
10.
11.
12.
低效的Shell脚本设计会进一步影响原本解释器模式下并不见长的程序运行效率,使其在面对大数据量文本分析时的资源和时间消:耗变得难以接受.本文通过分析Shell语言及其应用需求的特点,从分层设计的角度提出"自底向上进行Shen脚本编程"的理论,同时提出从"外部系统环境"到"内部执行模式"全面地掌握工具软件的方法.实例充分... 相似文献
13.
14.
维、哈、柯多文种考试系统的设计 总被引:1,自引:1,他引:0
少数民族语言文字在数据库中的处理是现代信息处理领域中的非常重大的课题之一。论文分析开发维、哈、柯多文种考试系统的难点和要解决的技术问题,重点讨论新疆交通厅职业技能签定专业理论考试系统维哈柯多文种版的全部开发过程。论文介绍的多文种信息的数据库处理技术将在少数民族语言信息处理研究领域中有普遍的指导意义。 相似文献
15.
面向体育比赛的大规模直播脚本快速及时地反映了比赛的实时进程,但依靠体育新闻记者来据此人工撰写新闻报道往往耗时费力。鉴于此,该文提出了一种自动生成体育直播脚本所对应的体育新闻的神经网络模型,该模型在一定程度上避免了传统模型过于依赖人工选择特征的局限性,同时还能综合考虑脚本中句子级局部信息与全局信息以及句子和新闻内容间的语义关联性,从而实现联合建模下的体育新闻生成。在公开数据集上的实验结果验证了该文所提方法的可行性和有效性。此外,还尝试了基于规则和模板来自动生成体育新闻的标题以突显新闻正文的关键内容。 相似文献
16.
17.
针对视频复杂运动事件进行了分析, 对用于自然语言处理的格语法理论进行了扩展, 增加时间格结构, 并采用扩展后的格框架对复杂事件进行了标注, 并将数据存储在数据立方体中, 最后采用MDFP-growth方法对多维概念格进行关联规则的挖掘。在实验部分, 对比了扩展后的格框架与扩展前原方法对复杂事件标注的结果, 并比较扩展了时间格后的四维数据〈PRED, Ag, T, Loc〉和扩展前三维数据〈PRED, Ag, Loc〉挖掘其关联规则中系统运行时间, 产生规则数对比结果及视频检测的准确率和召回率对比。实验证明, 提出的方法能更加准确地标注出复杂事件, 并具有更高的处理效率。 相似文献
18.
一种支持多语言文本布局方向的文档处理模型 总被引:1,自引:0,他引:1
文档处理是文字处理的关键组成部分,针对多语言混合排版的需求,本文提出了基于“框”的支持不同方向的多语言文本布局的文档处理模型。该模型把对文本布局方向的处理封装在文档格式化模块中,将多文本布局方向的问题规约为文本布局方向为从左向右(水平)的文档格式化的问题,并设计了多文本布局方向文档格式化的递归算法。该模型可以很好支持包括我国民族文字蒙古文、维吾尔文、藏文在内的各种不同书写方向文字的文本布局。 相似文献