排序方式: 共有89条查询结果,搜索用时 15 毫秒
31.
目标社区检测旨在找到符合用户偏好的有凝聚力的社区.然而,所有现有工作要么在很大程度上忽视社区的外部影响,要么不是"基于目标的",即不适合目标请求.为了解决这一问题,提出面向属性网络的融合用户兴趣偏好与社区影响力的目标社区发现方法,挖掘与用户偏好相关且最具一定影响力的高质量社区.首先,综合节点结构与属性信息,挖掘包含样例节点的极大k-团作为潜在目标社区核心,并设计熵加权属性权重计算方法来捕获潜在目标社区属性子空间权重,挖掘用户偏好;其次,融合社区内部紧密性和外部可分离性定义社区质量函数,以极大k-团为核心扩展得到高质量的潜在目标社区;最后,定义社区的外部影响分数量化办法,并结合社区质量函数值及外部影响分数对所有潜在目标社区排序,输出综合质量较高的社区为目标社区.此外,在计算极大k-团的属性子空间权重时,设计了2重剪枝策略提升方法的性能和效率.在人工网络和真实网络数据集上的实验结果印证了所提方法的效率和有效性. 相似文献
32.
图像描述生成结合了计算机视觉和自然语言处理2个研究领域,不仅要求完备的图像语义理解,还要求复杂的自然语言表达,是进一步研究符合人类感知的视觉智能的关键任务.对图像描述生成的研究进展做了回顾.首先,归纳分析了当前基于深度学习的图像描述生成方法涉及的5个关键技术,包括整体架构、学习策略、特征映射、语言模型和注意机制.然后,按照发展进程将现有的图像描述生成方法分为四大类,即基于模板的方法、基于检索的方法、基于编码器-解码器架构的方法和基于复合架构的方法,并阐述了各类方法的基本概念、代表性方法和研究现状,重点讨论了基于编码器-解码器架构的各种方法及其创新思路,如多模态空间、视觉空间、语义空间、注意机制、模型优化等.接着,从实验的角度给出图像描述生成的常用数据集和评估措施,并在2个基准数据集上比较了一些典型方法的性能.最后,以提升图像描述的准确性、完整性、新颖性、多样性为依据,展示了图像描述生成的未来发展趋势. 相似文献
33.
针对传统特征加权方法未充分考虑词语之间的语义信息和类别分布信息的不足,提出了一种融合词语共现距离和类别信息的短文本特征提取方法。一方面,将同一短文本中两个词语之间的间隔词数作为共现距离,计算它们之间的相关度。通过计算这两个词语共同出现的频率,得到每个词的关联权重;另一方面,利用改进的期望交叉熵计算某个词在某个类别中的权重值,将两者整合,得到某个类别中所有词的权重值。对所有类别中的词按权重值的大小进行降序排序,选取前K个词作为新的特征词项集合。实验表明,该方法能够有效提高短文本特征提取的效果。 相似文献
34.
35.
随着社交网络的发展,越来越多的研究利用社交信息来改进传统推荐算法的性能,然而现有的推荐算法大多忽略了用户兴趣的多样化,未考虑用户在不同社交维度中关心的层面不同,导致推荐质量较差.为了解决这个问题,提出了一种同时考虑全局潜在因子和不同子集特定潜在因子的推荐方法LSFS,使得推荐过程既考虑了用户共享偏好又考虑了用户在不同子集中的特定偏好.考虑到参与到不同社交维度的用户对不同的项目感兴趣,首先根据用户的社交关系将用户划分到不同的子集中;其次通过截断奇异值分解技术建模用户对项目的评分,其中全局潜在因子捕获用户共享的层面,而不同用户子集的特定潜在因子捕获用户关心的特定层面;最后,结合全局与局部潜在因子预测用户对未评分项目的评分.实验结果表明该方法可行且有效. 相似文献
36.
37.
针对差分隐私直方图发布中区间查询的不一致问题,研究已有需迭代调整的局部最优线性无偏估计算法LBLUE,提出一种不需迭代且满足一致性约束查询的CA算法。通过对1棵添加Laplace噪声的满k-叉区间树进行一致性调整:先利用TDICE算法进行自顶向下的不一致估计,再利用BUCE算法进行自底向上的一致性估计,得到满足一致性约束查询的差分隐私满k-叉区间树,遍历后发布满足一致性约束查询的直方图数据。经过证明和实验分析,一致性调整后的查询区间满足一致性约束查询,且精确度优于Boost-2算法和LBLUE算法的,同时算法的时间效率高于LBLUE算法的。 相似文献
38.
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧,然后基于文本间包含相同类别的强类别特征数量来衡量文本间的相似度.最后,本文结合耦合距离区分度和强类别特征来衡量短文本的相似度.经实验证明本文提出的方法能够提高短文本相似度计算的准确率. 相似文献
40.