共查询到20条相似文献,搜索用时 187 毫秒
1.
2.
中文智能信息检索中的关键是自然语言处理技术,汉语自动分词技术是中文自然语言处理的基础.基于机械匹配的分词方法简洁、实用,但该方法切分精度不高且无法有效克服切分歧义.针对机械匹配最大匹配算法的应用进行了改进,并将相似串应用于教学资源自然语义查询. 相似文献
3.
4.
本文从实际问题中抽象出相异型单属性匹配问题的数学模型,提供了结合图论的描述方法,详细讨论了算法的构造和正确性,并且给出了用PASCAL语言在微机上实现的程序和模拟结果。 相似文献
5.
6.
基于递归式最大匹配法的数据库查询接口的实现 总被引:1,自引:0,他引:1
针对中史自然语言应用在数据库查询这一特殊领域,提出了比较适用于数据库查询的递归式最大匹配法,它是最大匹配法的改进算法。在该算法的基础上,实现了一个中文自然语言数据库查询的接口,该接口允许用户随意输入中文自然语言,把用户的输入语句处理后生成存放中间结果的多又树,然后根据多又树生成SQL语句,进行数据库查询。 相似文献
7.
8.
中文分词是文本过滤的首要的基础性工作,也是智能化中文信息处理的关键。本文提出了一种结合正向最大匹配法和互信息的中文分词算法。实验结果说明,该算法能在一定程度上提高文本的分类性能。 相似文献
9.
全二分最大匹配快速分词算法 总被引:29,自引:1,他引:29
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。 相似文献
10.
改进的正向最大匹配分词算法 总被引:2,自引:1,他引:1
为了降低正向最大匹配分词算法的切分错误率,分析了产生这个错误率的原因,提出了一种改进的正向最大匹配分词算法,即增加一个交集型歧义字段处理模块.该方法对待切丈本进行预处理,在传统正向最大匹配的过程中,调用交集型歧义字段处理模块,该模块主要是在每一次正向匹配后进行回溯匹配,即通过检测当前处理词条的尾字和下一字的成词情况,分别计算该尾字和不含该字的当前处理词条的互信息与尾字和下一字的互信息,通过比较两者的互信息大小来决定切分,最后对分词碎片进行了处理.通过对随机抽取的语料进行测试,结果表明该方法是有效的. 相似文献
11.
12.
本文提出了一种新的圆孤逼近轮廓曲线进行目标匹配的方法—最大比率法。曲线上两点之间的圆弧和曲线夹成的面积与对应扇形的比值随曲线上点的曲率的变化而变化。通过设置一个阈值,算法可以检测曲率较大的特征点,用于圆弧逼近匹配。 相似文献
13.
提出了一种新的圆孤逼近轮廓曲线进行目标匹配的方法-最大比率法。曲线上两点之间的圆弧和曲线夹成的面积与对应扇形的比值随曲线上点的曲率的变化而变化。通过设置一个阈值算法可以检测曲率的较大的特征点用于圆弧逼近匹配。 相似文献
14.
一种最大匹配问题DNA计算算法 总被引:3,自引:0,他引:3
DNA计算作为基于生化反应的一种新的计算模式,凭借其巨大的并行性和海量的存储能力已经成为解决NP难题的潜在解决方案之一.把传统计算机中的剪枝技术引入到DNA计算算法的设计中,提出一种基于Adleman模型生物操作与粘贴模型解空间的最大匹配问题DNA计算新算法.算法由图编排器、预解空间生成器、匹配生成器及最大匹配搜索器组成.与已有同类算法的对比分析表明:该算法在保持多项式操作时间的条件下,将求解最大匹配的解空间从O(2m)减少到O(1.618m),将DNA计算机在试管内可求解的最大匹配问题的规模从60(260≈1018)提高到86(1.61886≈1018).同时,与传统的穷举算法相比,该算法具有高效的空间利用率及容错技术的优点. 相似文献
15.
文章提出了一种最大概率匹配的矢量量化编码算法,它为码书中的每一码字增加一个计数器,统计在编码图象时每个码字的出现的频数,并进行排序;在量化矢量时,根据当前码字出现频数大小依次选择侯选码字,即频数大的码字优先选为候选码字。该算法可以和已有的预测法结合,形成预测加最大概率匹配的联合矢量量化编码算法。实验表明,联合算法的效率较高,在最初几次的搜索中就能以较高的命中率命中最佳匹配码字。 相似文献
16.
为了提高基于谱特征的图像匹配算法的精度和鲁棒性,提出了一种基于最大池的谱特征匹配算法。首先,利用图像特征点邻域信息提取具有旋转不变性和亮度线性变化不变性的谱特征;其次,将以谱特征描述的特征点作为节点、特征点之间的欧氏距离作为边构造属性关系图,将图像匹配问题转化为图匹配问题;最后,引入最大池匹配策略获取图匹配结果。大量实验结果表明,该算法提高了谱特征匹配算法的精度和鲁棒性。 相似文献
17.
随着Internet用户数量的激增,突破IP路由器的性能限制已成为当前研究的热点。过去,路由器每个端口的价格要远高于交换机端口的价格。随着对路由器研究的深入,这一情况也相应改变。传统的路由器采用的是集中式控制结构,通常用一到两个处理器来实现其功能。为了增加通信量,最新的路由器采用了与交换机相类似的分布式体系结构,如图1所示。其中,中 相似文献
18.
本文基于异步通讯网络,对二分图最大匹配问题,建议了两个分布式算法。其中第一个简单算法的通讯复杂性为O(n(n~2+m))、时间复杂性为 O(n~3);第二个算法的通讯复杂性为O(n~(1/2)(n~2+m))、时间复杂性为O(n~(5/2)),这里n和m分别为二分图的结点个数及边的数目。关于这一问题的分布式算法目前尚未见诸报导,这里建议的算法很可能是此问题的第一个分布式算法。 相似文献
19.
20.
做为最直接的分词思路,最大匹配具有直观、实现简单等优点,但也存在着精度低的致命缺点.本文对正向匹配算法做了实现和分析,为该方法的进一步改进打下了基础. 相似文献