首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   25篇
  国内免费   2篇
  完全免费   10篇
  自动化技术   37篇
  2012年   5篇
  2011年   5篇
  2009年   2篇
  2008年   3篇
  2007年   2篇
  2006年   1篇
  2005年   4篇
  2004年   4篇
  2002年   2篇
  2001年   3篇
  1997年   1篇
  1996年   1篇
  1995年   2篇
  1994年   2篇
排序方式: 共有37条查询结果,搜索用时 46 毫秒
1.
快速中文字符串模糊匹配算法   总被引:12,自引:3,他引:9  
本文解决了中文字符串模糊匹配的两个主要问题:空间问题和时间问题.目前字符串模糊匹配的两个主要方法是位向量方法和过滤方法.由于汉字众多,应用位向量方法时,需要大量空间.对于某些内存很少的小型计算机,比如嵌入式系统,这将会是一个问题.本文改进了位向量方法,使其在应用于中文字符串时,空间需求降低到约5%.本文还利用汉字非常多的特点,提出一种新的基于过滤方法的中文字符串模糊匹配算法,BPM-BM,其速度比世界上最快的算法至少提高14%;在大部分情况下,是其速度的1.5~2倍.  相似文献
2.
基于近似匹配模型的XML元数据检索   总被引:4,自引:0,他引:4  
将无序标签树匹配分解为树结构匹配和标签语义匹配,采用树结构匹配和语义匹配相结合的方法,对传统树匹配算法进行了改进,提出了近似匹配概念,并针对元数据XML描述的结构化特征,设计了一种基于三层近似匹配模型的元数据检索方法。这种检索方法可根据用户的不同需求有效地调节元数据的查准率和查全率。最后构造了基于近似匹配模型的元数据查询系统原型,实验证明近似匹配模型在元数据检索应用中具有可行性和高效性。  相似文献
3.
数据分析和清理中相关算法研究   总被引:4,自引:0,他引:4  
数据清理的一个主要作用是识别重复的记录.结合过滤算法和启发式剪枝算法提出了启发式剪枝改进算法.然后,针对重复记录的特点提出了长度约束条件,能有效地提高比较字段不等长时的执行速度.数据库中经常会出现各种形式不同的缩写,而启发式剪枝算法等无法识别缩写情况下的重复记录,本文因此提出了基于动态规划的缩写发现算法,该算法既可以用于缩写发现也可用于缩写存在时的重复记录识别.另外,重复记录的甄别目前必须人工处理,传统方式下用户不得不逐条浏览和分析,工作时间冗长而且乏味,容易引入新的数据质量隐患,作者提出了聚类清除方案和聚类闭包算法,它将重复的记录聚类显示,用户一次可以处理完一个重复聚类,在有效提高速度的同时方便了用户.  相似文献
4.
允许错误的(汉字)字符串快速检索技术   总被引:3,自引:1,他引:2       下载免费PDF全文
在计算机应用的诸多领域中都会遇到字符串似检索问题。本提出了一种技术。它通过应用搜索状态向量及字符-模式匹配向量,将字符串匹配比较转化简单的整数字位运算,有效地解决了字符/汉字串的相似匹配问题,中也给出了实现算法并分析了算法的复杂性。  相似文献
5.
中文信息检索系统的模糊匹配算法研究和实现   总被引:3,自引:0,他引:3  
在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到"子线性"的效率。  相似文献
6.
一个高效的图像库检索模型   总被引:2,自引:0,他引:2  
多媒体数据库主要研究如何对数据庞杂的多媒体数据进行存取,检索等管理,图像库在许多未来的应用中将会作为一个重要的部分,该文通过对传统图像库检索系统的改进,提出一个高效的图像库检索模型,它首先通过神经网络方法的图像进行分类,然后通过数据挖掘中的方法完善属性值,最后通过近似匹配检索出所需要的图像。  相似文献
7.
This paper proposes a tree kernel method of semantic relation detection and classification(RDC) between named entities.It resolves two critical problems in previous tree kernel methods of RDC.First,a new tree kernel is presented to better capture the inherent structural information in a parse tree by enabling the standard convolution tree kernel with context-sensitiveness and approximate matching of sub-trees.Second,an enriched parse tree structure is proposed to well derive necessary structural informat...  相似文献
8.
基于Struts框架的垃圾短信过滤模块的设计   总被引:2,自引:0,他引:2       下载免费PDF全文
为了提高对垃圾短信的拦截效率,提出一种同时从发送号码、发送频率以及短信内容3个方面对垃圾短信进行过滤的方法。通过黑白名单从发送号码进行一次过滤,对群发短信进行内容分析过滤,发送频率的引入可以实现黑名单的自动生成。以内容过滤为核心,并对其进行了阐述,基于Struts框架进行设计与实现了一个垃圾短信拦截模块。实验结果表明,查准率达到了90.69%。  相似文献
9.
As historical Chinese calligraphy works are being digitized, the problem of retrieval becomes a new challenge. But, currently no OCR technique can convert calligraphy character images into text, nor can the existing Handwriting Character Recognition approach does not work for it. This paper proposes a novel approach to efficiently retrieving Chinese calligraphy characters on the basis of similarity: calligraphy character image is represented by a collection of discriminative features, and high retrieval speed with reasonable effectiveness is achieved. First, calligraphy characters that have no possibility similar to the query are filtered out step by step by comparing the character complexity, stroke density and stroke protrusion. Then, similar calligraphy characters axe retrieved and ranked according to their matching cost produced by approximate shape match. In order to speed up the retrieval, we employed high dimensional data structure - PK-tree. Finally, the efficiency of the algorithm is demonstrated by a preliminary experiment with 3012 calligraphy character images.  相似文献
10.
一种有效的并行汉字/字符串相似检索技术   总被引:1,自引:0,他引:1       下载免费PDF全文
王素琴  邹旭楷 《软件学报》1995,6(8):463-467
本文提出了一种有效的并行汉字/字符串相似检索技术.通过引入搜索状态向量及字符一模式匹配向量,该技术将字符串匹配比较转化为简单的整数字位运算,通过对字符串方向相反的搜索有效地实现了多处理机对汉字/字符串的并行相似检索.文中也给出了并行实现算法,同时分析了算法的复杂性.  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号