排序方式: 共有15条查询结果,搜索用时 46 毫秒
1.
2.
3.
4.
5.
一种改进的字符串模式匹配算法 总被引:1,自引:0,他引:1
提出一种改进的字符串模式匹配算法.该算法对文本串进行预处理,即对文本串中不存在于模式串中的字符以及文本串中剩下的出现次数最少的字符分别进行标记,再通过匹配模式串的首尾字符来减少出现次数最少的字符的标记个数.发生匹配失败时,将模式串直接滑动到标记了的出现次数最少的字符处.通过实验证明,该算法的移动次数和比较次数有较大减少,耗费的额外空间的大小也不超过模式串的长度,进一步提高模式匹配的效率. 相似文献
7.
基于启发式规则的网页主题信息精确定位方法* 总被引:3,自引:0,他引:3
目前大部分的信息抽取方法都是针对主题信息块的提取,没有进一步深入到各个单独主题信息的抽取。针对这一问题,提出了一种基于启发式规则的网页主题信息精确定位方法。首先针对各个单独的主题,分析其多方面的特征,制定出对应的启发式规则;然后利用不同的规则对定位主题重要度不同的这一特点,得到启发式规则的权值矩阵;最后利用基于启发式规则的定位算法精确定位各个主题。将该方法用于网页主题信息抽取系统中,抽取系统能够有效地对各个单独的主题进行定位和抽取。实验结果表明,该方法具有很好的有效性和准确性。 相似文献
8.
9.
关系词语对于标明复句关系有重要的作用。在用计算机来实现汉语多重关系复句的关系层次分析的过程中,关系词语的提取和标引是首要的任务。本文针对利用计算机处理汉语复句的研究需求,结合词性标记和关系词搭配理论,提出了一种关系词提取算法——正向选择算法。通过测试可知,关系词提取的正确率达到89.88%,这表明了算法的有效性以及用于利用计算机处理汉语复句的可行性。 相似文献
10.
关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。 相似文献