首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 122 毫秒
1.
本文实现了一个基于综合匹配法的汉字识别后处理系统,该方法既利用了帝级识别结果的信息,又利用了汉语中字的上下文制约关系,即组字成词的信息,同时用了词的使用频度。  相似文献   

2.
手写汉字中笔划,部件及其位置关系均产生较大变化,这种变化是引起手写汉字特征不稳定的主要因素。为了减小上述不利影响,使手写汉字特征的描述趋于稳定,本文给出了一种基于汉字基元之间的模糊关系识别手写汉字的方法。  相似文献   

3.
本文吸收了词汇功能语法(LFG)的一些基本思想和句法模式识别的知识,给出了一个期望驱动的基于语法和语义分析的汉字识别后处理系统。  相似文献   

4.
Web服务发现过程本质上是用户请求和服务匹配的过程。传统的UDDI发现技术是通过精确匹配实现的,不能较好地支持基于概率和语义约束的模糊匹配。针对这种情况,在基于现有的OWL-S匹配上,进一步增加了以隶属函数、语义距离、阈值为基础的模糊匹配,形成了两级匹配。并通过对语义表示的服务能力进行模糊聚类,这种机制减少了搜索空间,提高了发现效率及匹配的精度。  相似文献   

5.
本文提出了一种基于web的字符串的模糊匹配方法.将给定的源字符串S和T目标字符串按照分割好的字符串单元进行匹配,得到两个字符串的相似程度.此方法不同与串的模式匹配.  相似文献   

6.
本文在传统Hopfield ANN基础上,对汉字识别某些方式提出一种新的方法,并在输出匹配的可行性上进行新的探索。在汉字字库的建立方法上提出新的观点,研究表明,本文所述方法是行之有效的,提高了汉字识别率。  相似文献   

7.
阳辉  金可音  汤双权  徐利谋 《微机发展》2007,17(11):125-127
Web服务发现过程本质上是用户请求和服务匹配的过程。传统的UDDI发现技术是通过精确匹配实现的,不能较好地支持基于概率和语义约束的模糊匹配。针对这种情况,在基于现有的OWL-S匹配上,进一步增加了以隶属函数、语义距离、阈值为基础的模糊匹配,形成了两级匹配。并通过对语义表示的服务能力进行模糊聚类,这种机制减少了搜索空间,提高了发现效率及匹配的精度。  相似文献   

8.
本文提出了一种基于web的字符串的模糊匹配方法。将给定的源字符串S和T目标字符串按照分割好的字符串单元进行匹配,得到两个字符串的相似程度。此方法不同与串的模式匹配。  相似文献   

9.
基于推理和相似度计算的语义Web服务匹配策略   总被引:1,自引:0,他引:1  
将本体的概念引入Web服务提升了服务的语义表达能力和发现能力,传统的语义Web服务匹配主要有基于推理和基于本体相似度计算两种方式.基于推理的服务匹配较容易实现,具有稳定的查准率和较高的运行效率,但同一级结果间不能进一步区分结果的匹配度.基于相似度计算的服务发现可以精确地描述结果与查询条件的匹配程度,便于用户比较,但实现较为复杂,并且在最坏情况下有糟糕的响应时间.在基于推理的服务匹配策略的基础上,提出了一种带有语义相似度计算的服务匹配策略,并用一个书籍领域本体的匹配实例进行了说明.  相似文献   

10.
基于语义和Hopfield网络的模糊汉字识别   总被引:7,自引:0,他引:7  
谭旭  乐晓波  朱亨荣  陈荣元 《计算机工程》2004,30(22):140-141,189
模糊不清汉字的辨认在文本处理中是一个尚未完全解决的难题,该文提出了一种基于语义分析和Hopfield网络相结合的算法,在一定程度上可以解决印刷字体中较为模糊不清汉字的识别问题。实验结果表明,该方法的识别正确率较高。  相似文献   

11.
基于多知识源的同音词识别方法   总被引:1,自引:0,他引:1  
本文提出了基于多知识源的同音词识别方法。该方法利用上下文条件测试函数实现了不定范围的信息相关处理,并根据词性、语义、位置、音节和词频等多种关联信息进行同音词综合识别,取得了较好的同音词识别效果。  相似文献   

12.
互联网是广告推广的重要媒介,但是低质、诈骗、违法等违规广告也大量充斥其中,严重污染网络空间,因此,实现恶意广告的有效甄别对构建安全清朗的网络环境意义重大。针对各类违法违规中文广告内容的识别需求,利用Bert(bidirectional encoder representation from transformers)和Word2vec分别提取文本字粒度和词粒度嵌入特征,使用CNN(convolutional neural networks)网络对Bert高层特征做深层抽取,同时将词粒度特征向量输入到双向LSTM(long short-term memory)网络提取全局语义,并采用Attention机制对语义特征强化,将强化特征和Bert字粒度特征进行融合,充分利用动态词向量和静态词向量的语义表征优势,提出一种基于强化语义的中文广告识别模型CARES(Chinese advertisement text recognition based on enhanced semantic)。在真实的社交聊天文本数据集上的实验表明,与使用卷积神经网络、循环神经网络等文本分类模型相比,CARES模型分类性能最优,能更加精确识别社交聊天文本中的广告内容,模型识别的正确率达到97.73%。  相似文献   

13.
从现代汉语语义学角度,可将句义类型划分为简单句义、复杂句义、复合句义和多重句义4种。作为在整体上对句义结构进行描述的方式之一,句义类型识别是对汉语句子进行完整句义结构分析的重要步骤。该文基于谓词及句义类型块提出了一种汉语句义类型识别的方法,实现了4种句义类型的识别。该方法先通过句中谓词的个数进行初步识别判断出部分简单句,再对剩余的句子先用C4.5机器学习的方法得到句中谓词经过的最大句义类型块的个数,再结合句法结构中顶端句子节点进行判决,最终给出剩余句子的句义类型判定结果。实验采用BFS-CTC汉语标注语料库中10221个句子进行开集测试,句义类型的整体识别准确率达到97.6%,为基于现代汉语语义学的研究奠定了一定的技术研究基础。  相似文献   

14.
汉语词语语义相似度计算研究   总被引:12,自引:0,他引:12       下载免费PDF全文
夏天 《计算机工程》2007,33(6):191-194
汉语词语的语义相似度计算是中文信息处理中的一个关键问题。该文提出了一种基于知网、面向语义、可扩展的相似度计算新方法,该方法从信息论的角度出发,定义了知网义原间的相似度计算公式,通过对未登录词进行概念切分和语义自动生成,解决了未登录词无法参与语义计算的难题,实现了任意词语在语义层面上的相似度计算。针对同义词词林的实验结果表明,该方法的准确率比现有方法高出近15个百分点。  相似文献   

15.
为了强化文本蕴含系统深层语义分析与推理能力,该文提出了基于事件语义特征的中文文本蕴含识别方法。该方法基于事件标注语料生成事件图,将文本间的蕴含关系转化为事件图间的蕴含关系;利用最大公共子图的事件图相似度算法计算事件语义特征,与统计特征、词汇语义特征和句法特征一起使用支持向量机进行分类,得到初步实验结果,再经过基于事件语义规则集合的修正处理得到最后的识别结果。实验结果表明基于事件语义特征的中文文本蕴含识别方法可以更有效地对中文文本蕴含关系进行识别。  相似文献   

16.
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借词识别的维吾尔语拉丁化规则;根据以上规则对维吾尔语拉丁化,并对汉语词进行拼音化,将借词发音相似转换为字符串相似这一易量化标准;提出了位置相关的最小编辑距离模型、加权公共子序列模型以及二者的带参数融合模型。实验结果表明,综合考虑字符串全局相似性和局部相似性的带参数融合模型取得了最佳的识别效果。  相似文献   

17.
提出了一种基于曲面匹配的虹膜识别方法,直接利用2幅虹膜图像对应的像素点灰度进行匹配。该方法主要包括虹膜图像尺寸和灰度范围的归一化、匹配区域的选择、匹配相似度阈值的估计以及对人眼旋转的自动校正。该文选择在眼毛、眼睑通常遮挡不到的一个较小的区域作为虹膜匹配区域,使该方法具有较宽的适应能力。没有特征提取过程,使得该方法具有计算量小的特点。图像之间的匹配过程使得伪造和窃取虹膜编码变得困难。实验表明该方法具有较高的识别率。  相似文献   

18.
提出了一种基于《知网》的汉语未登录词语义相似度计算方法。该方法首先参照意合网络理论构造了语义关系匹配函数;接着在用概念图表示未登录词语义信息的基础上,根据节点在语义表示中的作用不同对其分类;然后应用匹配函数对弧、节点对及节点对集进行分类;最后设计了未登录词的整体相似度、不同类型节点对及节点对集相似度的计算方法。该方法能够合理分类未登录词的语义信息并能将其充分利用到计算过程中,实验结果证明此方法是有效的。  相似文献   

19.
基于知识图的汉语词汇语义相似度计算   总被引:2,自引:1,他引:1  
提出了一种基于知识图的汉语词汇相似度计算方法,该方法以《知网》2005版为语义知识资源,以知识图为知识表示方法,在构造词图的基础上,以知网中的语义关系为依据对词汇概念中的义原进行分类,通过计算不同类型义原的相似度得到概念的相似度;为了对词汇相似度计算方法进行客观评价,设计了词汇相似度计算方法的量化评价模型;采用该模型对所提出的计算方法进行评价,试验结果证明此方法的有效度为89.1%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号