排序方式: 共有57条查询结果,搜索用时 15 毫秒
21.
数学公式广泛存在于各类文献之中,因此数学公式的自动定位、识别、分析和理解是文档图像处理必须研究的问题.但是数学公式和普通文本存在很大区别,所以数学公式的识别、分析远比文字段落的识别困难.本文回顾了数学公式图像处理的研究历程,提出了公式处理的模型,总结比较了公式定位、公式识别、公式分析以及性能评估等方面的主要处理方法,并展望了未来的研究方向. 相似文献
22.
23.
中英文混合文章识别问题 总被引:11,自引:0,他引:11
当前,已经有大量为单一字符集(或语种)而设计的OCR(optical character recognition)分类器.同时,随着全球一体化,多语文档的出现越来越普遍.因此,设计多语文档处理系统势在必行.提出了一般性的解决方案:两项OCR技术、一个系统和语言判断.为了使研究工作具体化,实现了一个中英文混合文章处理系统.其中主要涉及了3个关键问题:系统流程控制、汉英语言区域分离和英文字符切分.与以往的系统相比,该系统增加了汉英语言区域分离模块,并将基于等间距性的新方法应用于该模块.为了验证本系统的有效性,综合以往的方法实现了另一个系统.实验结果表明,该系统的性能明显优于另一个系统,在杂志样和书籍样上的识别率分别从98.48%和98.68%提高到99.13%和99.25%. 相似文献
24.
针对窄带系统对超宽带冲激无线电系统(Impulse Radio Ultra-wideband,IR-UWB)的干扰问题,提出基于Rayleighritz理论的直接序列(Direct Sequence,DS)设计方案,记为RRDS。通过设计DS序列,使得IR-UWB频谱在窄带干扰频率点上产生陷波,从而实现抑制干扰的目的,同时,通过RRDS方案,提高IR-UWB系统的误码率。RRDS方案先建立目标矩阵,并求解最小特征值及对应的特征向量。如果特征向量里面的元素有非+1或-1的值,则通过符号函数将特征向量转变为全部由+1,-1组成。若最小特征值是多重,先将所有的特征向量通过符号函数转变为全部由+1或-1组成的向量,并在这些向量里找出使目标矩阵的值最小的特征向量,将此向量作为直接序列DS。仿真结果表明,提出的RRDS方案有效地抑制窄带干扰,并提高了IR-UWB系统的误码率。 相似文献
25.
以对比语言−图像预训练(Contrastive language-image pre-training, CLIP)模型为基础, 提出一种面向视频行为识别的多模态模型, 该模型从视觉编码器的时序建模和行为类别语言描述的提示学习两个方面对CLIP模型进行拓展, 可更好地学习多模态视频表达. 具体地, 在视觉编码器中设计虚拟帧交互模块(Virtual-frame interaction module, VIM), 首先, 由视频采样帧的类别分词做线性变换得到虚拟帧分词; 然后, 对其进行基于时序卷积和虚拟帧分词移位的时序建模操作, 有效建模视频中的时空变化信息; 最后, 在语言分支上设计视觉强化提示模块(Visual-reinforcement prompt module, VPM), 通过注意力机制融合视觉编码器末端输出的类别分词和视觉分词所带有的视觉信息来获得经过视觉信息强化的语言表达. 在4个公开视频数据集上的全监督实验和2个视频数据集上的小样本、零样本实验结果, 验证了该多模态模型的有效性和泛化性. 相似文献
26.
研究关于掌纹鉴别系统的性能评测问题,设计并实现了一个用于性能评测的自动测试系统(ASPE),此系统采用的是掌纹识别系统的处理核心。同时还提出了一种基于特征点(终点和分叉点)的评测方法和用于量化评估的俩个主要指标-召回率和准确率.此系统可以直接在样张上显示标准特征点和提取特征点,方便开发人员的对比并发现问题,从速度和精确度的测试结果看出自动的性能评测在效率和准确上都大大超过了人工测试。 相似文献
27.
28.
29.
30.