首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
万莛 《微型机与应用》2012,31(8):62-63,66
最大匹配算法是中文分词中最常用的方法,但其有着过分依赖于词典的弊端。对最大匹配算法进行了深入探讨与研究,使用n-gram技术更新词典解决其弊端,从而提高分词效果。最后通过双向匹配算法与n-gram相结合的实验验证了该方案的可行性,并对该方案进行了总结。  相似文献   

2.
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础.基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义.针对机械匹配最大匹配算法的应用进行了改进,并将相似串应用于教学资源自然语义查询.  相似文献   

3.
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分词中出现的交集型歧义。该算法可以在分词的过程中显著提高分词的精确度,适用于对词语切分精度要求较高的中文语言处理系统。  相似文献   

4.
本文从实际问题中抽象出相异型单属性匹配问题的数学模型,提供了结合图论的描述方法,详细讨论了算法的构造和正确性,并且给出了用PASCAL语言在微机上实现的程序和模拟结果。  相似文献   

5.
串的最大匹配算法   总被引:3,自引:0,他引:3  
本文给出了一个找出二串间最大匹配的算法,该算法可用于比较两个串的相似程度,它与串的模式匹配有别。  相似文献   

6.
基于递归式最大匹配法的数据库查询接口的实现   总被引:1,自引:0,他引:1  
针对中史自然语言应用在数据库查询这一特殊领域,提出了比较适用于数据库查询的递归式最大匹配法,它是最大匹配法的改进算法。在该算法的基础上,实现了一个中文自然语言数据库查询的接口,该接口允许用户随意输入中文自然语言,把用户的输入语句处理后生成存放中间结果的多又树,然后根据多又树生成SQL语句,进行数据库查询。  相似文献   

7.
8.
中文分词是文本过滤的首要的基础性工作,也是智能化中文信息处理的关键。本文提出了一种结合正向最大匹配法和互信息的中文分词算法。实验结果说明,该算法能在一定程度上提高文本的分类性能。  相似文献   

9.
全二分最大匹配快速分词算法   总被引:29,自引:1,他引:29  
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。  相似文献   

10.
改进的正向最大匹配分词算法   总被引:2,自引:1,他引:1  
为了降低正向最大匹配分词算法的切分错误率,分析了产生这个错误率的原因,提出了一种改进的正向最大匹配分词算法,即增加一个交集型歧义字段处理模块.该方法对待切丈本进行预处理,在传统正向最大匹配的过程中,调用交集型歧义字段处理模块,该模块主要是在每一次正向匹配后进行回溯匹配,即通过检测当前处理词条的尾字和下一字的成词情况,分别计算该尾字和不含该字的当前处理词条的互信息与尾字和下一字的互信息,通过比较两者的互信息大小来决定切分,最后对分词碎片进行了处理.通过对随机抽取的语料进行测试,结果表明该方法是有效的.  相似文献   

11.
最大匹配问题的粘贴DNA算法   总被引:1,自引:1,他引:0  
吴雪  宋晨阳  张楠  朱煜  陈志华 《计算机科学》2013,40(12):127-132,140
最大匹配问题(MMP)是图论中经典的组合优化问题。针对此问题提出了基于DNA粘贴计算模型的求解算法,阐述了该算法如何利用DNA链构建最大匹配问题的初始编码,说明了应用粘贴计算模型寻求最终解的生物操作过程,同时分析了此DNA并行算法的计算复杂度,最后给出了该算法的计算机模拟仿真结果和应用实例,得到了所给问题的最大匹配解,并对算法的可行性进行了验证和总结。  相似文献   

12.
本文提出了一种新的圆孤逼近轮廓曲线进行目标匹配的方法—最大比率法。曲线上两点之间的圆弧和曲线夹成的面积与对应扇形的比值随曲线上点的曲率的变化而变化。通过设置一个阈值,算法可以检测曲率较大的特征点,用于圆弧逼近匹配。  相似文献   

13.
提出了一种新的圆孤逼近轮廓曲线进行目标匹配的方法-最大比率法。曲线上两点之间的圆弧和曲线夹成的面积与对应扇形的比值随曲线上点的曲率的变化而变化。通过设置一个阈值算法可以检测曲率的较大的特征点用于圆弧逼近匹配。  相似文献   

14.
一种最大匹配问题DNA计算算法   总被引:3,自引:0,他引:3  
DNA计算作为基于生化反应的一种新的计算模式,凭借其巨大的并行性和海量的存储能力已经成为解决NP难题的潜在解决方案之一.把传统计算机中的剪枝技术引入到DNA计算算法的设计中,提出一种基于Adleman模型生物操作与粘贴模型解空间的最大匹配问题DNA计算新算法.算法由图编排器、预解空间生成器、匹配生成器及最大匹配搜索器组成.与已有同类算法的对比分析表明:该算法在保持多项式操作时间的条件下,将求解最大匹配的解空间从O(2m)减少到O(1.618m),将DNA计算机在试管内可求解的最大匹配问题的规模从60(260≈1018)提高到86(1.61886≈1018).同时,与传统的穷举算法相比,该算法具有高效的空间利用率及容错技术的优点.  相似文献   

15.
文章提出了一种最大概率匹配的矢量量化编码算法,它为码书中的每一码字增加一个计数器,统计在编码图象时每个码字的出现的频数,并进行排序;在量化矢量时,根据当前码字出现频数大小依次选择侯选码字,即频数大的码字优先选为候选码字。该算法可以和已有的预测法结合,形成预测加最大概率匹配的联合矢量量化编码算法。实验表明,联合算法的效率较高,在最初几次的搜索中就能以较高的命中率命中最佳匹配码字。  相似文献   

16.
为了提高基于谱特征的图像匹配算法的精度和鲁棒性,提出了一种基于最大池的谱特征匹配算法。首先,利用图像特征点邻域信息提取具有旋转不变性和亮度线性变化不变性的谱特征;其次,将以谱特征描述的特征点作为节点、特征点之间的欧氏距离作为边构造属性关系图,将图像匹配问题转化为图匹配问题;最后,引入最大池匹配策略获取图匹配结果。大量实验结果表明,该算法提高了谱特征匹配算法的精度和鲁棒性。  相似文献   

17.
随着Internet用户数量的激增,突破IP路由器的性能限制已成为当前研究的热点。过去,路由器每个端口的价格要远高于交换机端口的价格。随着对路由器研究的深入,这一情况也相应改变。传统的路由器采用的是集中式控制结构,通常用一到两个处理器来实现其功能。为了增加通信量,最新的路由器采用了与交换机相类似的分布式体系结构,如图1所示。其中,中  相似文献   

18.
本文基于异步通讯网络,对二分图最大匹配问题,建议了两个分布式算法。其中第一个简单算法的通讯复杂性为O(n(n~2+m))、时间复杂性为 O(n~3);第二个算法的通讯复杂性为O(n~(1/2)(n~2+m))、时间复杂性为O(n~(5/2)),这里n和m分别为二分图的结点个数及边的数目。关于这一问题的分布式算法目前尚未见诸报导,这里建议的算法很可能是此问题的第一个分布式算法。  相似文献   

19.
基于最大匹配的中文分词概率算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
结合顺序表和跳跃表的快速查询特性,提出一种改进的整词分词词典结构,主要采用哈希法和二分法进行分词匹配,并针对机械分词算法的特点,引入随机数,探讨一种基于最大匹配的分词概率算法。实验表明,该算法具有较高的分词效率和准确率,对消去歧义词也有较好的性能。  相似文献   

20.
王希杰 《福建电脑》2011,27(4):72+71-72,71
做为最直接的分词思路,最大匹配具有直观、实现简单等优点,但也存在着精度低的致命缺点.本文对正向匹配算法做了实现和分析,为该方法的进一步改进打下了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号