排序方式: 共有17条查询结果,搜索用时 19 毫秒
11.
12.
13.
针对现有的小样本关系三元组抽取方法难以解决单句话中存在多个三元组以及未考虑支持集和查询集之间语义相似性等问题, 提出了一种基于模块转移和语义相似性推断的小样本关系三元组抽取方法. 该方法采用一种在关系抽取、实体识别和三元组判别这3个模块不断转移的机制, 高效地提取出查询实例中存在的多个关系三元组. 在关系抽取部分, 将BiLSTM和注意力机制相融合, 以更好地捕捉应急预案文本的序列信息. 此外, 在实体识别部分设计了一种基于语义相似性推断的方法识别句子中存在的应急组织机构实体. 最终, 在应急预案领域数据集ERPs+上进行了大量的实验. 实验结果显示, 相较于其他基线模型, 所提模型更适应于应急预案领域的关系三元组抽取任务. 相似文献
14.
一种基于聚类的文本特征选择方法 总被引:6,自引:0,他引:6
传统的文本特征选择方法存在一个共性,即通过某种评价函数分别计算单个特征对类别的区分能力,由于没有考虑特征间的关联性,这些方法选择的特征集往往存在着冗余。针对这一问题,提出了一种基于聚类的特征选择方法,先使用聚类的方法对特征间的冗余性进行裁减,然后使用信息增益的方法选取类别区分能力强的特征。实验结果表明,这种基于聚类的特征选择方法使得文本分类的正确性得到了有效的提高。 相似文献
15.
现有的基于深度学习的业务流程剩余时间预测方法大多采用传统的长短期记忆循环神经网络构建预测模型,由于传统长短期记忆循环神经网络对序列数据的建模能力有限,导致现有方法的预测效果还有较大提升空间。针对现有方法的不足,提出一个基于注意力双向循环神经网络的业务流程剩余时间预测方法。该方法使用双向循环神经网络对流程实例数据进行建模,同时引入注意力机制自动学习流程实例中不同事件的权重。此外,为了进一步提升学习效果,基于迁移学习的思想设计了一种迭代学习策略,为不同长度的流程实例分别构建剩余时间预测模型,提高了模型的针对性。实验结果表明,所提方法与传统的方法相比具有明显的优势。 相似文献
16.
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。 相似文献
17.
自动文摘是自然语言处理领域的一个重要研究话题,基于机器学习的自动文摘方法则是该项研究中的一个热点。然而,自动文摘问题中的数据分布有一个重要现象,即文摘句子与非文摘句子的数量相差非常悬殊,该现象将给传统机器学习算法的应用效果带来负面影响。为此,本文针对自动文摘中句子类别分布严重不平衡这一现象,以支持向量机算法为基础,设计了两种有效的处理非平衡自动文摘数据的分类方法。在第一种方法中,将传统支持向量机中正负类平衡的分类间隔转换为不平衡的分类间隔;在第二种方法中,通过将数据集进行切分,设计了一种支持向量机集成学习算法。通过在DUC2001数据集上的实验证明,本文设计的两种基于非平衡数据分类的单文档自动文摘方法显著优于基于传统分类算法的自动文摘方法。 相似文献