排序方式: 共有22条查询结果,搜索用时 15 毫秒
1.
2.
3.
基于海量图书的分类需求,提出了一种融合知识图谱(Knowledge Graph, KG)与转换器双向编码器(Bidirectional Encoder Representation from Transformers, Bert)的图书文本分类模型。通过构建面向图书领域知识图谱扩展图书文本的语义信息,并且使用深度学习的方法获取文本深层语义信息,将扩展语义信息与深层语义信息相结合后,通过TextCNN进行图书分类。经研究试验表明,融合知识图谱与深度学习的图书文本分类算法相对于只使用深度学习进行图书分类算法,前者的分类效果更佳。 相似文献
4.
预估点击率(CTR)是推荐系统的核心任务之一,基于此提出一种深度挖掘用户和内容特征的CTR预估模型——DFAR模型。在用户特征提取部分,通过长短期记忆网络(LSTM)对用户时序特征进行提取,通过残差模块与注意力机制实现对用户特征的深度提取。首先,在待推荐内容部分利用因子分解机(FM)来提取浅层特征。然后,使用多头注意力机制和残差网络从待推荐内容中提取深度特征。最后,将用户特征与待推荐内容特征做内积结合并做出最终预测。最终在Movielens-100K数据集上利用该模型进行实验,实验结果表明,提出的模型在AUC值上相比于深度因子分解机(DeepFM)模型提升了1.45%。验证了DFAR模型对CTR预测的有效性。 相似文献
6.
7.
8.
神经机器翻译(Neural Machine Translation, NMT)性能依赖于语料库的数据量和数据质量,经研究分析发现英文数据中存在多词粘连的现象,以下统称为粘连词,出现粘连词影响数据质量。为了进一步提高数据质量,需将粘连词还原成独立词,即词与词之间由空格作为分隔符的形式。针对该问题提出使用Transformer模型对粘连词进行还原。在数据预处理阶段,对数据采取三种不同的策略。实验证明,对数据进行分词、BPE切分的策略最佳,在真实数据集上准确率达到95.5%,在Transformer模型的基础上添加后处理操作后的正确率达到98.5%。该文方法具备可迁移性,对于任一种单词间用空格分割的语言都是可用的。 相似文献
9.
ORACLE与SQL SERVER语言的比较 总被引:1,自引:0,他引:1
在不同的关系数据库管理系统(RDBMS)之间,存在很多差异,ORACLE和SQL SERVER都符合SQL-92标准的属性扩展,从应用程序的开发人员的角度来看,ORACLE和SQL SERVER对数据管理方式没有太大的区别,ORACLE和SQL SERVER之间的内部差异却是十分明显,本文研究了ORACLE和SQL SERVER的区别是为了实现ORACLE向SQL SERVER转换。 相似文献
10.
英文光学字符识别的后处理 总被引:2,自引:0,他引:2
总结了英文光学字符识别(OCR)系统中的常见错误类型,论证了使用拼写检查技术发现错误的可能性,以最相似单词替换OCR的错误输出,从而达到改正错误的目的。利用编辑距离实现词汇相似性评估,并用动态规划技术优化了编辑距离的计算。试验结果证明该方法可以使OCR系统的单词识别率提高6.25%。 相似文献