首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对社会性标注系统标签之间缺乏层次关系的问题,将本体引入Folksonomy中。使用TF-IDF方法计算标签与网页之间的关系,得出标签之间的相似度,并通过一种凝聚式层次聚类算法,将社会性标注系统内的标签分别划分到不同簇,使得具有相同主题的标签聚集到一起。将每个簇内的标签看作一个节点,通过使用本体学习方法在每个簇内生成标签本体。实验结果表明了该方法的可行性和有效性。  相似文献   

2.
网页正文提取是WEB挖掘的重要步骤。传统网页正文提取方法都需要经过分块这一步骤之后来识别网页正文块,提出了利用行文本之间的内容相似度和标签相似度结合的方法来提取网页正文。该算法避免了传统网页提取算法的分块步骤,在规范网页之后,先提取网页的最大文本行,然后计算每行文本与最大行的内容相似度和标签相似度,再结合内容相似度与标签相似度来提取网页正文。实验中,利用随机抽取的网页进行了测试,其测试精度接近95%,表明该算法在实际中是有效的。  相似文献   

3.
针对基于内容的图像检索(CBIR)中图像底层视觉特征与高层语义特征之间存在的"语义鸿沟"问题,提出了一种基于卷积神经网络(CNN)特征和标签信息融合的图像检索算法。首先使用CNN模型提取图像的CNN特征以及标签信息,然后使用余弦距离分别计算这两个特征的相似度,最后将这两个相似度进行加权融合,用作图像检索排序准则。在caltech101和caltech256数据集上分别进行实验,实验结果表明,所提算法加强了图像特征与高层语义的结合,大大提高了图像检索的查准率。  相似文献   

4.
针对如何快速有效地对音乐信息进行查询、检索和组织的问题,提出了一种基于生成对抗网络模型的多标签音乐自动标注系统.通过音乐自动语义标注技术,可以提高音乐检索系统的性能.利用LDA方法对音乐标签进行聚类以获取主题类别,再通过生成对抗网络,找到音乐的音频特征与语义特征之间的映射关系.应用于CAL500数据集的5次交叉验证实验结果表明,该方法的综合性能指标与现有方法相比有较大的提升.  相似文献   

5.
协同过滤作为当前应用最成功的推荐技术之一,其推荐质量在很大程度上取决于近邻用户选取的准确性,而数据的稀疏性问题(sparsity)和相似度度量方式(similarity metrics)严重影响着最近邻的选择。该文提出了一种引入加权异构信息的改进协同过滤算法。首先利用异构网络中丰富的语义信息和边属性信息,得到用户之间基于不同元路径的相似度;然后将相似度分别应用到典型的基于用户的协同过滤推荐算法中,得到基于每个相似度的用户评分值;最后采用监督学习算法为每个打分值分配不同的权重,融合为用户最终评分。在扩展MovieLens经典数据集上的实验结果表明,本文所提算法在精确度上较传统算法有显著提高。  相似文献   

6.
在多标签分类问题中,标签之间往往是相关的,为了提高分类性能,利用标签之间的相关性,提出AdaBoost.MLR算法和标签相关性分析方法。AdaBoost.MLR算法采用余弦相似度来计算标签相关性矩阵,利用标签相关性矩阵对原始标签矩阵进行补全转换为模糊标签矩阵,将标签空间划分为标签集、标签相关集和标签无关集,结合标签之间的相关性和弱分类器的分类情况,对样本权重进行调整。AdaBoost.MLR算法也能解决多类别分类问题,在其标签相关性的计算中,根据已经训练的弱分类器得到的临时强分类器的分类结果,构造标签相似性矩阵。实验结果表明,文中提出的算法在实验数据集上优于现有的算法,尤其在标签相关性复杂的数据集上分类性能有显著提升。  相似文献   

7.
现有的标注聚类算法大多采用传统的K-means或Single-linkage算法对标注数据直接聚类,但是K-means或Sin-gle-linkage本身固有的缺陷严重影响了聚类结果的质量.给出了一种局部中心度传播聚类算法LCIPC(local centrality in-formation passing clustering),该算法首先在标注相似度的基础上建立标注数据的KNN有向邻居图G;然后利用核密度估计方法计算每个标注的局部中心度;再通过随机游走方法在图G中传播局部中心度,以产生全局中心度等级;最后,调用图深度优先搜索算法发现标注聚类结果.在3个真实数据集上的聚类结果显示,LCIPC算法具有够获得高质量标注聚类结果的能力.  相似文献   

8.
针对社会化标签系统所对应的标签共现复杂网络,引入标签语义相似度权值和抽象权值算子,建立了标签语义相似度计算模型。相比基于"用户-对象-标签"三元组的统计性计算公式或基于复杂网络拓扑结构的节点相似性计算公式,本模型可以在标签语义相似度计算中将标签标注行为的统计特性与复杂网络的拓扑特性有机地结合起来,形成一个具有良好数学性质的形式化系统。仿照模糊逻辑中T范数、S范数给出了抽象权值算子的具体化实现,形成具体化算子簇,可以通过调节参数(如参数h和阶数l)形成不同类型或不同全局性的具体化算子。设计实验方案,利用复杂网络链路预测的AUC指标、Precision指标对典型算子及算子簇进行了综合分析。分析结果表明,这些具体化算子同时具有"语义补充"、"语义破坏"两种相反作用,在算子阶数较低(如2≤l≤5)时能明显提高标签语义相似度计算的准确性,在社会化标签系统的高精确性个性化推荐算法设计中具有应用价值。  相似文献   

9.
为跨越高层语义概念与底层视觉特征之间的语义鸿沟, 本研究提出一种新的图像自动标注方法。该方法首先采用灰度直方图方法对图像分割并提取图像区域的纹理特征, 然后利用FCM算法中增大关联度高的特征权重更好地实现对分割后图像区域的聚类效果。最后改进贝叶斯分类器建立图像区域和语义概念间的关联模型, 通过比较测试图像和训练图像间的最大相似度实现测试图像的自动标注。在Corel通用图像数据集上与其他几种方法进行了对比实验, 实验结果表明改进后的标注方法优于传统标注方法。  相似文献   

10.
提出了一种能耗均衡的自适应数据存储算法, 将数据尽量存储在适合查询的位置. 首先建立基于网格的网络模型, 然后分析采集节点与初始存储节点、查询节点之间的位置关系, 存储模式可在集中存储和分布存储之间切换. 算法引入了虚拟扩展网格和能量分级消耗的机制, 可有效均衡网络能耗. 实验结果表明, 该算法的节点能耗、生命周期和丢包率相比于GHT算法有一定的改善.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号