排序方式: 共有92条查询结果,搜索用时 0 毫秒
31.
中文金融评价文本是了解金融行情和判断金融行业繁荣程度的主要载体,对其中的评价要素进行抽取和分析可以在一定程度上的帮助决策者做出判断.传统的抽取方法更侧重于寻找规则,工作量大,且在句子复杂或者不规范的情况下,难以充分考虑句子的句法特征.为了解决该问题,本文构建BBG-BMC模型,利用基于图自注意力机制的混合词编码模型BB... 相似文献
32.
由于传统的监督学习方法很大程度上依赖于大量的标注数据,近年来,无需外部监督信息的自监督学习方法受到了极大关注.对比学习是一种有效的自监督学习方法,它通过对比相似样本和不相似样本,使得模型能够学习到样本的重要内在特征,进而应用于下游任务,在计算机视觉和自然语言处理等领域得到了越来越广泛的应用.本文系统地梳理了对比学习研究现状.首先介绍了对比学习的起源和主要思想,然后归纳了对比学习在设计映射函数、正负例构造和损失函数构造等方面的研究动态,接着重点介绍了面向计算机视觉和自然语言处理的对比学习研究;最后,分析了现有研究存在的问题,探讨了对比学习未来的研究趋势和发展方向. 相似文献
33.
在因特网上,每个主题往往拥有成百上千个相关的深网数据源,从众多的数据源中找到合适的源进行数据集成变得越来越重要.传统的考虑源质量的选择方法是不考虑源主题特性的,而是根据经验选取统一的质量维度,因而在不同主题下选择准确性有较大的差异.基于此,提出基于用户反馈的深网源选择方法,依据用户反馈获取特定主题源的核心质量维度从而建立质量评价模型.选取了三个不同主题下的数据源进行了相关的验证,实验结果表明,针对不同主题下的数据源选取,该方法均具有较高的准确性且计算量较少. 相似文献
34.
基于区间编码方案分裂大型XML文档到关系存储 总被引:6,自引:0,他引:6
将一个XML文档分裂存储到关系数据库中,通常的方法是利用DOM对该XML文档进行解析,并利用DOM接口提供的XML文档树信息来实现分裂。但是,DOM在解析一个大型XML文档时效率特别低,甚至是无法胜任。文中对转换XML文档到关系数据库中进行存储和查询的策略以及区间编码方案进行了综述;基于区间编码方案探讨了如何分裂一个大型XML文档到关系存储的基本原理,并给出了相应的算法。实验结果表明,该方法是通用的、高效的。 相似文献
35.
基于权重查询词的XML结构查询扩展 总被引:9,自引:0,他引:9
文本文档信息检索中检索质量不高的一个主要原因是用户难以提出准确的描述查询意图的查询表达式. 而XML文档除了具有文本文档的内容特征外,还具有结构特征,导致用户更难以提出准确的查询表达式.为了解决这一问题,提出一种基于相关反馈的查询扩展方法,可以帮助用户构建满足查询意图的"内容 结构"的查询表达式.该方法首先进行查询词扩展,找到最能代表用户查询意图的权重扩展查询词;然后在扩展查询词的基础上进行结构查询扩展;最终形成完整的"内容 结构"的查询扩展表达式.实验结果表明,与未进行查询扩展相比,扩展后prec@10和prec@20的平均准确率提高30%以上. 相似文献
36.
38.
39.
基于可信度的中文完整词自动识别 总被引:1,自引:0,他引:1
中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求。 相似文献
40.