排序方式: 共有68条查询结果,搜索用时 0 毫秒
31.
32.
数据空间技术是数据库管理技术的进一步发展,如何有效地搜索数据空间中的资源成为一个值得研究的问题.为此提出一种基于语义的数据空间资源搜索机制(S-RSM,Semantics-based Resource Search Mechanism for Dataspace).定义了资源描述模型,能够有效地将数据资源进行统一描述和包装;提出一种基于语义的资源搜索策略,利用Dbped ia语义知识库评估资源对象关联和语义项关联.同其它搜索策略相比,S-RSM在查全率和查准率等方面具有一定的优势. 相似文献
33.
基于多源社交网络上的用户信息实现跨网络链路预测具有重要的意义,有助于进行用户推荐、行为分析、偏好推荐。传统的链路预测技术仅考虑社交网络上的局部结构特征,有些网络规模庞大、节点稀疏、存在大量孤立点,易导致建模困难、计算效率低等问题。基于此,提出了一种基于元路径选择和矩阵分解的跨社交网络链路预测方法。首先,根据跨社交网络中用户间的社会关系构建一个网络图;然后,利用元路径的节点活跃度和边的活跃度自动提取特征;接下来,利用矩阵分解将目标类型对象相关的元路径信息在低维空间上显示;最后,利用集成分类方法对链接模型进行优化。实验数据表明,提出的链路预测方法具有较高的准确性。 相似文献
34.
决策树作为一种经典的分类算法,因其分类规则简单易懂被广泛应用于医学数据分析中.然而,医学数据的样本不平衡问题使得决策树算法的分类效果降低.数据重采样是目前解决样本不平衡问题的常见方法,通过改变样本分布提升少数类样本的分类性能.现有重采样方法往往独立于后续学习算法,采样后的数据对于弱分类器的构建不一定有效.鉴于此,提出一种基于C4.5算法的混合采样算法.该算法以C4.5算法为迭代采样的评价准则控制过采样和欠采样的迭代过程,同时依据数据的不平衡比动态更新过采样的采样倍率,最终以投票机制组合多个弱分类器预测结果.通过在9组UCI数据集上的对比实验,表明所提出算法的有效性,同时算法也在稽留流产数据上实现了准确的预测. 相似文献
35.
现有的图协同过滤算法在现实场景中存在数据稀疏问题,同时在相邻信息聚合的过程中使得特征学习更容易受到交互噪声的影响。为了解决上述问题,提出一个基于自监督的多视角图协同过滤(SMGCF)推荐方法,通过图神经网络学习用户和项目节点的嵌入表示。在学习节点嵌入表示的过程中,考虑到单个节点间的交互关系以及聚类节点间的聚类关系对推荐结果的影响,引入自监督学习来辅助图协同过滤算法进行多视角关系的挖掘。针对节点交互级关系视角,通过数据增强得到多个用户-项目交互二分图,并且提出一种节点交互级关系的对比学习方法;针对节点聚类级关系视角,提出一种节点聚类级关系的对比学习方法。通过多视角融合策略将2种类型的对比学习方法进行融合,从而提升节点嵌入效果。在4个公开的数据集上进行实验,实验结果证明了SMGCF的可行性和有效性。相比最优基准方法NCL,SMGCF在Recall@10和NDCG@10指标上最高可提升2.1%和4.3%。 相似文献
36.
实体解析是数据集成、数据挖掘等技术中不可或缺的步骤,其具体任务是查找引用自同一真实世界的实体的数据记录.现有的方法多数是通过计算实体记录的属性相似度来评估是否为同一实体,由于该方法需要预先对齐记录属性,无法适应属性中token误放的情形,也不能有效利用跨属性中tokens的语义和结构信息,影响实体识别准确性.本文提出了一种采用主题异构图嵌入的token粒度的实体解析方法(THGE-ER).在token、属性和记录基础上,利用LDA模型为实体记录添加一个主题层级,并构建了一个由token、属性、记录和主题4类节点组成的主题异构图;采用区分节点类型的异构图嵌入表示方法,并将节点间的语义和结构信息嵌入到token层级的嵌入向量中;进一步结合多层次注意力机制,完成最终的实体解析决策.经过大量的实验证明,本文提出的方法表现出了良好的性能. 相似文献
37.
随着Web数据库的不断增长,通过对Deep Web的访问逐渐成为获取信息的主要手段.如何有效地抽取Deep Web中结果页面所包含的实体信息成为一个值得研究的问题.通过分析Deep Web结果页面的特点,提出了一种基于DOM树的Deep Web实体抽取机制(DOM-tree based entity extraction mechanism for Deep web, D-EEM),能够有效解决Deep Web环境中的实体抽取问题.D-EEM采用基于DOM树的自动实体抽取策略,利用DOM树中的文本内容和层次结构来确定数据区域和实体区域,提高了实体抽取的准确性;另外,提出了一种基于上下文距离和共现次数的语义标注方法,有效地将来自不同数据源的抽取结果进行合成.通过实验验证了D-EEM中所采用的关键技术的可行性和有效性,同其他实体抽取策略相比,D-EEM在抽取效率及抽取准确性等方面具有一定的优势. 相似文献
38.
在科学文献管理中,存在大量的科学技术文献需要被高效的识别、分类和保存.对于研究者来说,在研究该领域的相关知识时,通常会检索该领域的相关专家的文章,然而,姓名作为检索的常见搜索经常会出现歧义问题,这导致文献检索、统计和分析的质量下降.现有的方法在数据集上仍不能表现出良好的聚类效果,如何实现有效的消歧方法仍是一项挑战.本文... 相似文献
40.
命名实体识别和关系抽取是自然语言处理领域的两个重要基本问题.联合抽取方法被提出用于解决传统解决管道抽取方法中存在的一些问题.为了充分融合头实体和句子的语义信息,同时解决可能存在的重叠三元组问题,论文提出了一种新的实体关系联合抽取方法,主要通过序列标注的方式抽取实体关系.该方法主要使用条件层归一化(Condi-tional Layer Normalization)进行信息融合.同时,该方法还赋予了待抽取的头实体和尾实体不同的语义编码.实验结果表明,该方法在使用预训练的BERT预处理编码器的情况下,在NYT和WebNLG数据集上有很好的表现. 相似文献