首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
本文对藏文古籍著录的内容进行了具体的研究和分析,并对著录系统界面进行了设计和基本功能的实现。本系统包括了四个子系统,分别是书籍著录系统、铭刻著录系统、文书著录系统和讲唱著录系统。最后,本文详细介绍了书籍著录系统的设计和实现。  相似文献   

2.
藏文古籍数字图书馆设计研究   总被引:2,自引:0,他引:2  
对国内外数字图书馆的发展及现状进行了分析,研究了我国藏文古籍的特点及互联网上藏文信息的稀缺,根据古籍按民族分卷;民族按文种立卷的分类标准,采用J2EE规范,应用DreamWeaver、JSP和XML技术,对藏文古籍数字图书馆的体系结构进行了全面设计,提出了藏文古籍数字图书馆设计的几项关键性技术,实现了藏文古籍数字图书馆的各项需求,这一成果可使藏文古籍在数字化方面迈出了历史性的一步,是保存和延续发展民族文化遗产的最有效手段.  相似文献   

3.
本文以民族古籍数字化保护技术开发为基础,分析了民族古籍缩微胶片图像的特征,通过对目前已有的数字图像分割方法的优缺点讨论。找出民族古籍缩微胶片数字化图像分割的可行方法。  相似文献   

4.
为解决传统藏文古籍分类不准确和分类效率低的问题,提出基于迭代加权图像的藏文古籍逐级分类方法.首先通过迭代加权算法对藏文古籍进行样本建造,对样本进行反复协方差矩阵训练,使后续藏文古籍逐级分类更为精准.然后使用图像信息特征提取方法,对藏文古籍迭代加权图像进行特征信息提取,挑选出能为逐级分类提供较大贡献的图像信息.最后通过迭...  相似文献   

5.
探讨了建立藏文古籍文献搜索引擎的方法,分析了采用xml技术建立搜索引擎的优越性和必要性。并提出了基于xml搜索引擎的基本结构框架和实现的关键技术。  相似文献   

6.
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。  相似文献   

7.
针对藏文舆情分析中藏文印刷品和藏文图片内容无法自动监测的难题,文章在深入分析印刷藏文字符特征和藏文文本特点的基础上,提出支持多字体印刷藏文内容监测系统的实现方法,重点阐述藏文字符的特征提取、分类算法以及藏文文本内容监测方法。  相似文献   

8.
该文提出了一种简单、快速的藏文网页文本分类方法。该方法利用网页栏目中词条的类别特征,结合网页文本提取技术,实现了快速、精确地将藏文网页文本归于预定义类别中。实验表明,该方法具有很高的网页文本分类正确率,对构建高质量多类别藏文语料库有重要作用。  相似文献   

9.
在分析现有藏文自动分词方法的基础上,针对藏文分词系统中虚词识别的难点进行深入研究。根据传统藏文文法,描述了藏文虚词在文本中不同的表现形式,用规则和统计相结合的方法,建立了较为全面的虚词知识库和规则库,并给出切分用虚词分块算法,该方法在不同领域的3 200个较典型的藏文句子进行了测试,结果表明,该方法的虚词识别率高达98%以上。  相似文献   

10.
多字体印刷汉字识别中笔段直接抽取算法研究   总被引:1,自引:0,他引:1  
本文提出了一种抽取汉字笔段的算法。由于省去了细化过程,提高了处理速度和正确率。  相似文献   

11.
12.
Several algorithms have been proposed in the past to solve the problem of binary pattern recognition. The problem of finding features that clearly distinguish two or more different patterns is a key issue in the design of such algorithms. In this paper, a graph-like recognition process is proposed that combines a number of different classifiers to simplify the type of features and classifiers used in each classification step. The graph-like classification method is applied to ancient music optical recogniti on, and a high degree of accuracy has been achieved.Received: 27 December 2002, Accepted: 10 January 2003, Published online: 4 July 2003  相似文献   

13.
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。  相似文献   

14.
才藏太 《计算机工程与应用》2012,48(26):127-130,147
随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配算法和还原算法。  相似文献   

15.
分词是自然语言处理的一项基础性工作,对自然语言处理的后继工作有较大的影响。紧缩格的识别是藏文分词中最难最重要的技术之一。通过剖析已有藏文紧缩词识别方法,分析藏文字词的特征,针对性地提出了识别藏文紧缩格的规则算法、添加—还原算法和最大熵模型的特征模板,从而得到基于规则、添加还原法与最大熵模型相结合的藏文紧缩格识别方法。实验数据表明,该方法识别藏文紧缩格的准确率、召回率和F1值分别达99.26%、96.47%、97.85%,比现有最高的准确率有了较明显的提高。  相似文献   

16.
藏语连续语音语料库设计与实现   总被引:1,自引:0,他引:1  
以藏语夏河话为研究对象,建立了基于三音子的藏语连续语音语料库。首先收集了10万句藏语文本语料库,并根据夏河话的实际发音,进行了国际音标转写;然后总结了夏河话的三音子音联结构形式,并用藏语文本处理平台对其组合类型和在原始文本语料库中的频度进行了详细的统计分析;最后在语音库的语料设计中综合考虑了三音子以及类三音子的覆盖率和稀疏度,设计并完成了语料抽取算法,实现了语料自动选取。  相似文献   

17.
基于数字图像处理的EAN13码识别   总被引:2,自引:0,他引:2       下载免费PDF全文
主要研究通过数字图像处理的方法识别ENA13条形码图像条码信息的问题。首先介绍了条码结构。然后针对传统方法的缺陷引入基于图像处理的识别方法,通过图像预处理、图像分割、图像矫正和译码4个步骤识别条形码。阐述了针对含有噪声点的模糊图像和输入角度随机两种情况的条码识别。最后通过给出相关实验结果验证了算法的可行性和实用性。  相似文献   

18.
In this paper a novel computation method is proposed to perform the common vector approach (CVA) faster than its conventional implementation in pattern recognition. While conventional CVA calculations perform the classification with respect to the distance between vectors, the new method performs the classification using scalars. A theoretical proof of the equivalence of the proposed method is provided. Next, in order to verify the numerical equivalence of the proposed computation method to the conventional (vector-based) method, numerical experiments are conducted over three different face databases, namely the AR Database, extended Yale Face Database B, and FERET Database. Since the computational gain may depend on (i) the dimension of the feature vectors, (ii) the number of feature vectors used in training, and (iii) the number of classes, the effects of these items are clearly verified via these databases. Our theoretically equivalent (but faster) method provided no difference in the classification rates despite its improved classification speed as compared to the classical implementation of CVA. The new method is found to be about 2.1-3.0 times faster than the conventional CVA implementation for the AR face database, 1.9-3.3 times faster for the extended Yale Face Database B, and 1.9-3.1 times faster for the FERET Database.  相似文献   

19.
在分析火灾图像特性的基础上,运用数字图像处理技术和模式识别技术,提出了火灾识别的思想.给出了图像处理和识别的算法,该算法采用二维最大熵自动阈值法对火灾图像进行分割处理,分割后再提取可疑区域;对可疑区域的火焰进行识别,给出火焰存在的可能性;根据火灾火焰蔓延时的面积、相似度的变化来识别、判断火灾的发生.实验证明,与传统的检测方法相比,大大地提高火灾预报的准确率.  相似文献   

20.
数字式射线图像缺陷检测的C-V方法   总被引:3,自引:0,他引:3       下载免费PDF全文
数字式射线图像(DR图像)缺陷检测主要是进行缺陷区域的分割和测量,分割精度将直接影响到测量精度。C-V模型是一种新的基于曲线演化理论和水平集方法的图像分割模型,它结合区域信息使得分割结果全局最优,可以很自然地处理轮廓线拓扑结构的变化。针对工件DR图像特点,研究了一种DR图像缺陷检测的C-V方法:首先应用C-V模型进行DR图像缺陷区域的分割,在此基础上,完成缺陷区域几何参数的测量。实验表明,C-V方法能准确地分割出DR图像中的缺陷区域,并获得缺陷形心和面积等参数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号