首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于过滤的中文多模式近似字符串匹配算法   总被引:1,自引:0,他引:1  
当前近似字符串匹配算法主要针对英文等中小字符集,该文针对汉字等大字符集的有效算法很少,尤其缺少适合汉字等大字符集的多模式近似匹配算法的情况,提出了一种适合汉字等大字符集的多模式近似匹配算法——MBPM-BM,通过实验证明了该算法的有效性。 近似字符串匹配;中文字符串匹配;多模式匹配;位并行运算;过滤  相似文献   

2.
字符串匹配是计算机科学中最经典、研究最广泛的问题之一,并且已经被应用到了众多领域当中。然而随着计算机和网络技术的飞速发展以及新问题的不断提出,人们逐渐发现在实际应用中有时更需要进行近似字符串匹配。因此,研究高效的近似字符串匹配算法具有重要的理论价值和实际意义。  相似文献   

3.
袁先平  仲红  黄宏升  易磊 《计算机工程》2011,37(20):142-144
数据库中字符串近似匹配查询不能完全保护查询双方的隐私信息。针对该问题,提出一种对数据库中字符串数据的近似匹配查询协议。采用安全计算编辑距离协议、同态加密、茫然传输等安全技术,在有效保护查询双方隐私信息的情况下,实现对字符串近似匹配的查询,并分析该协议的正确性、安全性及复杂性,结果表明,该方案是安全有效的。  相似文献   

4.
近似字符串匹配是模式匹配研究领域中的一个重要研究方向。压缩后缀数组是字符串匹配、数据压缩等领域广泛使用的索引结构,具有检索速度快和适用广泛的优点。利用压缩后缀数组,提出了适合近似字符串匹配搜索算法的数据结构,并在此基础上提出了一种匹配搜索算法。实验结果表明,相对于现有的算法,提出的算法在小字母表的情况下具有计算优势。  相似文献   

5.
串匹配问题是计算机科学研究中比较广泛的问题之一,目前字符串匹配算法主要是针对英文等字符的匹配居多,而针对中文等字符的匹配比较少,本文将针对中文字符匹配的算法进行浅析,提出一种适合中文字符模式近似匹配算法的设计,通过实验证明了该算法的有效性。  相似文献   

6.
马安光 《程序员》2003,(10):107-108
问题描述见杂志2003年第8期算法分析 WWW搜索问题的本质是在给定的字符串中找到包含关键字符集合中所有关键字符串的最短子串,对本题所涉及的部分概念理解如下 (1)符合条件的短子串这是只包含所有关键字符但不包含多余字符的子串。例原子串:ECBWCZACBA;关键字符集:ABC,则子串为“BWCZA”、“ACB”、“CBA”,这些是符合条件的短子串。  相似文献   

7.
一种有效的字符串有序跳跃模式近似匹配算法   总被引:1,自引:0,他引:1  
字符串的模式匹配问题是计算机科学的基本问题之一,而近似模式匹配更是近期的研究热点。本文分析了文本分析领域中出现的一种特殊的近似模式匹配问题,即字符串有序跳跃模式近似匹配问题,提出了一种基于有限自动机的组件组合分析算法。算法的特点在于将组件匹配过程与组配过程进行分离,这样既降低了问题的复杂度,又可以实现按策略组配的灵活性。组件匹配过程中利用有限自动机对跳跃模式的组件进行匹配查找;组件的组配过程中先对查找到的组件进行组合分析,然后再对各种组合进行初步筛选和基于策略的优选。初步筛选工作是依据顺序性、唯一性和最大数三条原则进行;而优选工作是根据四个设计的评价参数选择其中最佳组合。实验结果表明,该算法的确能解决字符串有序跳跃模式匹配问题,完全可以适用于句型匹配与主题词跳词匹配。  相似文献   

8.
正则表达式是对一类字符串共性描述的规则,提供了一种从字符集合中搜寻特定字符串的机制。信息抽取的主要功能是从文本中抽取出特定的事实信息(factual information)。该文利用正则表示式快速匹配文本的特点,以抽取电子文档的主要信息为例,介绍了正则表达式理论以及在信息抽取中的应用。  相似文献   

9.
字符串近似匹配在网络安全中有广泛的应用。本文从中文字符串相似度角度出发,提出了通过单个汉字的细分来提高字符相似度的想法,并从汉字"成簇性"方面进行分析,引出了汉字的Key表示方法,将汉字与Key的映射关系归结为规则,讨论了规则的获取方法。设计了基于规则的中文字符串近似匹配的框架,提出了新的相似度计算模型,并通过实验对整个流程加以验证,证明基于规则的中文字符串近似匹配的优越性。  相似文献   

10.
安全多方计算是密码学界研究的热点问题,保密判断字符串匹配是安全多方计算的常见问题之一,其在文本处理领域中是非常重要的一个主题.它可以用于数据处理、数据压缩、文本编辑、信息检索等多种应用中.现有含通配符的字符串保密匹配算法大多数只能实现近似匹配,且通配符的使用受个数、位置的限制,使用不灵活.本文设计了一种新的编码方法,应用该编码方法和Paillier加法同态加密算法,在半诚实模型下设计了字符串模式匹配的保密判定协议和含通配符的字符串保密匹配协议,尤其是第二个协议有一些非常理想的特征,字符串中可以包含零、一个或多个通配符,通配符可以位于字符串的任意位置,一个通配符可以代表任意数量的字符.协议可以保密地实现字符串的精确匹配,通配符的使用也很灵活.其次,由于协议是基于同态加密而不是Bloom Filter构造的,从而消除了Bloom Filter造成的误判,实现了更高水平的隐私保护.采用模拟范例证明了协议的安全性,效率分析表明所设计的协议是高效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号