首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于笔划描述的样条汉字库及其应用   总被引:2,自引:1,他引:1  
轮廓法描述汉字字形是实现高质量,低成本汉字输出的重要途径,西方提出了一种基于笔划抽取的方法来获得汉字字形的样条轮廓描述,使得汉字字形的描述质量大为提高,且数据量较少,基于笔划抽样的样条汉字库可应用于汉字字形的衍生,自动变体和动态汉字库的生成。本文对笔划抽取方法进行了详细介绍,另外还对拟合过程中初始分段点的确定,取样点的选取,轮廓数据的平滑处理等问题进行了探讨,取得了较好的拟合效果。  相似文献   

2.
基于局部特征匹配的对称面提取算法   总被引:4,自引:0,他引:4  
在反求工程中,对称面提取对于点云的几何模型重建具有重要意义,根据对称性原理,给出了点云模型中双侧对称性的数学定义,在此基础上,构造了一种基于迭代最近点(ICP)数据匹配的对称面提取算法,该算法已经在反求工程CAD系统RE-SOFT中实现,并应用于汽车引擎罩、卫生洁具零件的模型重构。  相似文献   

3.
基于句法结构特征分析及分类技术的答案提取算法   总被引:1,自引:0,他引:1  
由于中文自然语言处理的特点和困难以及相应的语言处理基础资源的相对缺乏,使得国外一些成熟技术和研究成果不能直接应用到中文问答系统中.为此,针对中文事实型问答系统,提出一种新的基于句法结构特征分析及分类技术的答案提取算法,该方法将答案提取问题看成是候选答案的分类问题,即将候选答案分类为正确和错误两类.首先,该方法根据与问题类型所对应的候选答案的类型信息,从文本片断中提取出候选答案及其在句子中的简单特征和句法结构特征;然后利用这些特征训练分类器;最后用训练得到的分类器判别候选答案是否为正确答案.针对中文事实性问题,该方法与目前典型的基于模式匹配的中文答案提取算法相比,准确率提升6.2%,MRR提升9.7%.  相似文献   

4.
用语义模式提取实体关系的方法   总被引:5,自引:0,他引:5       下载免费PDF全文
邓擘  樊孝忠  杨立公 《计算机工程》2007,33(10):212-214
研究了信息抽取中的汉语实体关系提取技术,在使用模式匹配技术的基础上引入了词汇语义匹配技术对汉语实体关系进行提取。比较了一般模式匹配技术和词汇语义模式匹配技术在汉语实体关系提取任务中的性能。实验结果表明,一般模式匹配技术在处理中文时效果较差,而词汇语义模式匹配技术更适合于处理汉语实体关系提取任务。  相似文献   

5.
基于语义的中文事件触发词抽取联合模型   总被引:1,自引:0,他引:1  
中文事件触发词抽取是一项具有挑战性的任务.针对中文事件触发词抽取中存在的事件论元语义信息难以获取以及部分贫信息事件实例难以抽取的问题,提出了基于语义的中文事件触发词抽取联合学习模型.首先,根据中文句子结构灵活和句法成分多省略的特点,提出了基于模式匹配的核心论元和辅助论元抽取方法,这两类论元可以较好地表示论元语义,进一步提高中文事件触发词抽取性能;其次,根据同一文档中关联事件实例间存在的高度一致性,构造了一个关联事件语义驱动的中文事件触发词识别和类型分配二维联合模型,用于抽取贫信息事件实例.在ACE 2005中文语料上的实验结果表明:与现有最好的中文事件抽取系统相比,所提出方法的性能得到了明显提升.  相似文献   

6.
提出了一种基于茶学词典和统计算法相结合的荼学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的荼学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。  相似文献   

7.
提出了一种基于茶学词典和统计算法相结合的茶学知识概念抽取方法。该方法以茶学词典为基础,首先对非结构化数据源进行中文分词处理,然后采用两种统计算法对分词结果进行概念抽取。通过使用丰富的茶学词典来降低统计算法时间复杂度,提高了中文分词和概念抽取的精度和效率。实验结果表明,词库的丰富程度决定了概念抽取的效果,可以通过不断丰富词库,进一步提高概念抽取精度。  相似文献   

8.
汉字笔段形成规律及其提取方法   总被引:8,自引:0,他引:8  
该文从点阵图像行(列)连通像素段出发,研究汉字图像的笔段构成,发现汉字点阵图像仅由阶梯型笔段和平行长笔段两种类型的笔段构成,并归纳出阶梯型笔段和平行长笔段的形成规律.以笔段形成规律为基础提出了汉字笔段的提取方法,该方法将像素级汉字图像转变为以笔段为单位的图像,有利于汉字识别、汉字细化及汉字字体的自动生成.最后该文给出了印刷体和手写体汉字笔段提取的实验结果.  相似文献   

9.
一种地形图粘连汉字提取算法   总被引:1,自引:0,他引:1  
地形图中包含了大量的字体丰富的汉字注记,其中有一部分由于与其它图符对象相互粘连而使得对象的尺寸变大超过了预定的阈值或失去了原有的结构特性,大大增加了提取难度。本文提出了一种寻求最佳分割点的算法来去除粘连,提取汉字的算法,取得了良好的效果。首先,在已提取出的汉字周围确定一个局部搜索范围,当局部范围内存在大尺寸的对象时表明可能有潜在的粘连汉字;其次,以图象中的分枝点和端点为顶点,以其中的图段为边建立对应的图;然后,在图中寻找最佳分割点,将图符分割成不同的互相分离的几个部分;最后,用连通成分结构分析的方法来提取汉字。  相似文献   

10.
在逆向工程中,为了得到测量物体的完整点云,需要将不同视角获得的点云数据进行拼合,为了获得更精确的拼合效果,常采用向物体表面上粘贴参考点的方法来获取基准点.因此,参考点形心提取的精确程度直接影响拼合结果.通过分析逆向工程中的参考点图像的特点,首先提出了一种基于区域识别的参考点提取新型算法.然后利用改进序贯算法对区域识别进行优化,使运算效率得到了提高.最后,通过实验对该算法进行分析,进一步验证了该算法的有效性和准确性.  相似文献   

11.
基于笔划宽度提取的手写体汉字归一化方法   总被引:1,自引:0,他引:1  
王建平  蔺菲 《微机发展》2006,16(10):29-31
手写体汉字书写变形是手写体汉字识别预处理阶段的重要问题之一。为了有效地改善手写体汉字变形并识别手写体汉字,提出了手写体汉字笔划宽度提取,以及基于提取出的笔划宽度的手写体汉字归一化的方法。用上述方法在计算机上进行仿真实验,实验结果表明,手写体汉字归一化的方法既能保证原手写体汉字的形状结构特征不变,并可有效地改善手写体汉字变形差异。  相似文献   

12.
Chinese characters are mapped from the spatial domain into the parametric one for stroke extraction, and the dynamic programming matching (DP matching) algorithm is applied to recognize Chinese characters. This method overcomes not only the problem of noise sensitivity in the local feature approach, but also the problem of being time consuming in the global feature approach. Results are presented for two experiments conducted for a database called ETL8, which contains 881 Chinese characters and 160 variations for each one, to prove the usefulness of the MHT and DP matching methods. An actual recognition rate of 94.5% was obtained for 351 Chinese characters in the ETL8  相似文献   

13.
该文提出了一种汉字字形视觉重心的计算方法。首先收集常用汉字图像样本,通过图像预处理,提取出样本汉字的连通区域视觉平衡中心;然后招集被试对样本汉字进行视觉重心标注;再利用统计建模的方法,构建出连通区域视觉平衡中心和汉字整体视觉重心之间的关系模型。与相关方法比较,文中方法考虑了汉字视觉重心依赖于人的主观体验这一因素。该方法能广泛应用于汉字特征提取、汉字结构设计与优化等应用领域。  相似文献   

14.
基于组合词和同义词集的关键词提取算法*   总被引:4,自引:1,他引:3  
为了提高关键词的提取准确率,在对现有关键词抽取方法进行研究的基础之上,针对影响关键词提取准确率的分词技术、同义词现象等难点,提出了一种基于组合词和同义词集的关键词提取算法。该算法首先利用组合词识别算法极大地改进分词效果,能识别网页上绝大多数的新词、未登录词,为提高关键词自动抽取准确率奠定了坚实的基础;同时利用构造的同义词集,合并同义词的词频,避免了同义词在输出结果中同现;利用综合评分公式,充分考虑候选关键词的位置、长度、词性等特性。实验数据表明,该方法有较高的提取准确率。  相似文献   

15.
在无人机摄影测量中, 针对传统的地面点云提取方法对图像点云数据中的道路提取适应性较差的问题, 本文提出了一种无人机摄影测量点云道路自适应提取方法. 首先, 根据点云的空间几何特征将点云划分为3个类别; 然后, 针对非道路的点云类别采取相应的方法进行剔除; 最后, 对经过自适应提取方法得到的点云数据进行滤波平滑和基于颜色的区域生长分割处理. 实验结果表明, 该方法提取的道路点云的I类误差为4.97%, II类误差为1.14%. 该方法能够有效地提取目标道路路面, 提高了无人机摄影测量工程应用中点云数据处理的效率.  相似文献   

16.
提出一种基于小波的多尺度分析的图像特征点提取方法,给出了一种多分辨率分块特征点匹配的图像检索方法,多分辨率的分块策略使得相关反馈的自适应性得到了更好的保证,从而实现图像的快速、准确匹配。实验表明该方法在计算时间和精度上都是十分有效的。  相似文献   

17.
为了提高Web交互设计模式抽取的准确性,增加现有方法对中文站点的分析能力,提出了一种基于HTML词法分析的改进方法.利用设计的HTML词法分析器将Web页面表示成语法树,抽取Web交互设计模式的特征,并对特征的词条内容进行语义扩展,细化了特征抽取的粒度.实验结果表明,改进的方法在召回率和准确率等方面明显优于现有的方法,并在中文站点交互模式抽取方面取得了很好的效果.  相似文献   

18.
基于小波的车牌汉字特征提取   总被引:15,自引:0,他引:15       下载免费PDF全文
车牌识别系统是智能交通不可或缺的一部分.在车牌识别系统中,车牌首位汉字的特征提取和识别是一个难点.为此,将小波的多分辨率特性应用于车牌汉字特征的提取,提出了一种直接从灰度图象提取车牌汉字特征的提取方法.该方法首先提取图象的小波矩和基于小波分解的区域密度特征,然后以识别率好坏为最优依据,进行特征分量排序和选择,最后把特征矢量送入BP神经网络进行字符识别.该方法避免了一些传统汉字特征提取方法需要对图象进行二值化操作而造成的汉字字符结构信息丢失.提取的特征有效地反映了车牌汉字的局部和全局特征.实验结果表明该特征提取方法可以得到比较好的识别效果.  相似文献   

19.
本文对矢量场可视化中,在数据处理阶段的两个问题-表面抽取和插值定位,提出了基于 结点判定的表面抽取算法和通过局部映射的插值定位算法。  相似文献   

20.
A new method of dominant points (DPs) extraction is presented. For each boundary point, the method assigns a support region whose length is individually limited. Two steps are used to detect DPs. Firstly, points having higher curvature value than the estimated fluctuations over the support region are extracted as candidates. Secondly, adjacent candidates are merged and a final elimination step is performed on each region. Additionally a new error measurement scheme is introduced, which takes into account the error due to the polygonalisation and the deviation brought by each DP. This error is used to compare our algorithm to other methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号