共查询到14条相似文献,搜索用时 109 毫秒
1.
2.
3.
基于自扩展的信息抽取模式自动获取 总被引:1,自引:0,他引:1
提出一种从未标注的中文文本中基于自扩展策略自动获取事件抽取模式的算法,该算法从少数几个种子抽取模式开始,通过一个增量迭代的过程发现新的抽取模式,在每一轮迭代中采用类似于TF/IDF的评估方法对产生的候选模式进行排序,选择最优的模式并入当前模式集.应用该方法从人民日报语料中自动获取"职务变动"类事件的抽取模式,实验结果表明,该方法产生的抽取模式在中文文本事件抽取中具有较好的抽取性能,综合指标F值达到66 3%. 相似文献
4.
文本知识获取(Knowledge acquisition from text,简称KAT)是知识工程中的一个重要研究课题。重点研究如何从大规模Web网页文本中获取地理实体概念及其位置关系知识,本文首先介绍了如何自动和半自动地获取这些地理实体概念及其位置关系的文法模式,建立文法模式库;然后基于文法模式库获取例句来抽取候选概念并进行概念验证;最后利用基于图论的方法构造位置关系图,利用地理领域特定规则进行分析验证。作为统一概念图管理下概念空间的一个重要组成部分,地理实体概念及其位置关系本身不仅是知识库的一个重要部分,还可为知识库中其它领域的知识提供支持。 相似文献
5.
6.
随着互联网的迅速发展,Web逐步成为知识获取的重要资源。部分整体关系获取是知识获取中的重要组成部分。该文提出了一种利用搜索引擎从Web中获取部分整体关系的方法。首先构造一种基于部分整体关系分类的意图查询,利用意图查询可以有针对性地从Web中获取尽可能多的包含部分整体关系语料。然后根据网页中的HTML标记和意图查询的格式过滤语料,并从中抽取候选部分整体关系,最后基于部分整体关系在自然语言表述中的特点和汉语的构词规律,提出用于验证候选部分整体关系的度量标准。实验结果表明,该方法取得了较高的准确率和F值。在前20个结果中准确率为86%,最优F值为64%。 相似文献
7.
部分整体关系获取是知识获取中的重要组成部分。Web逐步成为知识获取的重要资源之一。搜索引擎是从Web中获取部分整体关系知识的有效手段之一,我们将Web中包含部分整体关系的检索结果集合称为部分整体关系语料。由于目前主流搜索引擎尚不支持语义搜索,如何构造有效的查询以得到富含部分整体关系的语料,从而进一步获取部分整体关系,就成为一个重要的问题。该文提出了一种新的查询构造方法,目的在于从Web中获取部分整体关系语料。该方法能够构造基于语境词的查询,进而利用现有的搜索引擎从Web中获取部分整体关系语料。该方法在两个方面与人工构造查询方法和基于语料库查询构造查询方法所获取的语料进行对比,其一是语料中含有部分整体关系的语句数量;二是从语料中进一步获取部分整体关系的难易程度。实验结果表明,该方法远远优于后两者。 相似文献
8.
9.
IHSMTS中实例模式获取机制的设计与实现 总被引:3,自引:0,他引:3
IHSMTS是一种交互式多策略机器翻译系统。给出了该系统中模式知识获取机制的设计和实现方法,在这种模式知识获取机制中有机地结合了多种知识获取方式,包括:人机交互方式、基于机器翻译的源译文对照信息的自动获取、模式精炼方式和基于先验双语语料对齐的批量方式等,并通过模式验证算法实现对冗余、冲突等的检查,从而保证加入到模式库中的模式知识的单调递增生,同时实现模式适应性和准确性的平衡,使系统能够对实例模式库进行动态添加完善,从而动态递增地改善翻译效果。 相似文献
10.
基于相容关系和区分矩阵的知识获取算法来分析信息不完备情况下的桥梁养护决策问题,根据对不完备决策表和完备决策表知识获取结果的对照分析来验证不完备信息系统中知识获取方法的有效性。结果表明,本文所采用的不完备信息系统知识获取方法能有效地消除信息不完备所带来的知识丢失和信息过度膨胀的情况。 相似文献
11.
粗集理论为从信息论角度研究知识粗糙熵和属性约简问题提供了一种重要的途径和方法。本文提出了基于容差关系下的不完备信息系统加权的知识熵和条件熵概念,将等价关系下的粗糙熵自然地推广到不完备信息系统的容差关系情形。本文的结果为在一般二元关系下的知识获取提供了理论依据。 相似文献
12.
地震数据采集是地震观测与研究的基础。提出一种基于NI高精度数据采集卡USB-4432和LabVIEW的地震数据采集系统设计方案,包括基于OP07和LM224N的前端调理电路,基于USB-4432和LabVIEW的实时采集与分析系统。为进一步提升采集信号质量,提出一种自适应小波阈值去噪算法,该算法能根据采集信号强度自适应去噪,提高采集信号信噪比(Signal-to-Noise Ratio,SNR)。实验表明,系统稳定可靠,相比传统小波阈值去噪算法,新算法能显著提高SNR。实验结果表明,系统去噪性能优良,应用价值较强。 相似文献
13.
在分析规则知识条件和结论所在等价类包含关系基础上,提出了一个新的属性相对重要性的定义,并给出一种以决策类为基础的逐渐增加条件属性直接获取最简分类规则方法,同时用实例进行了验证。 相似文献
14.
针对目前计算Rough集中U/P算法需要重复扫描决策系统、不断地进行属性值比较和排序的缺点,提出了一种基于树型结构的不可区分关系树,通过不可区分关系树实现了计算U/P的快速算法.该算法只需扫描一次决策系统,并且也避免了不断地进行属性值比较和排序.经实验验证该算法较目前基于排序的U/P算法更快,而且算法实现更简洁. 相似文献