共查询到20条相似文献,搜索用时 46 毫秒
1.
基于标签的推荐算法已成为研究热点,现有相关研究集中在利用标签改进协同过滤推荐算法和基于内容的推荐算法,鲜有研究把标签引入更先进的矩阵分解推荐算法。而现有矩阵分解推荐算法大多使用商品类别作为因子向量对用户偏好和商品特征建模,限制了其精度的提升。本文使用标签构建因子向量,提出一种新的基于标签的矩阵分解推荐算法。经过真实数据检测,本文提出的推荐算法较以往基于类别的矩阵分解算法在精度上有了显著提升。 相似文献
2.
社会化标签正被广泛的应用在网页文本的描述和分类方面,能够直接反映用户兴趣和商品特征,因而可用于个性化推荐系统中.在进行标签推荐时,需要考虑到标签间的关联度,而现有的标签关联度算法都是基于标签之间的共现关系或者直接基于语义词典,这些算法未考虑到标签与资源的相关性和资源与资源的相关性.本文提出了基于语义的标签关联算法,首先通过潜层狄利克雷分配模型和向量空间模型求得资源间的相关度,然后通过概率模型求得标签与资源的相关度,最后求得标签间的关联度.实验结果表明:基于语义的标签关联算法能够有效的提升社会化标签推荐系统的性能,与语义词典在语义上基本一致且能够实现语义词典未登录词的关联. 相似文献
3.
针对Sajjanhar等提出的基于距离聚合向量的图像检索算法的不足,提出一种改进距离聚合向量的图像检索算法。该算法在距离聚合向量的基础上加入最大连通聚合像素平均坐标的质心距离特征,新增的特征向量具有平移、旋转和尺度不变性。对于原聚合向量特征和新增的质心距离特征,分别采用不同的相似性度量函数进行相似度匹配。该改进算法融入比距离聚合向量更多的空间信息。实验结果表明,该算法具有更高的查全率和准确率。 相似文献
4.
《计算机应用与软件》2017,(11)
传统的推荐算法多以用户评分数据计算用户的兴趣偏好以及资源相似度,对稀疏数据以及新用户的推荐质量较低。考虑到用户标签数据的随意性和语义模糊性,提出基于标签网络分割聚类的语义规范化方法并建立基于规范化标签的用户兴趣模型。该模型能在不改变用户兴趣的前提下有效降低用户标签兴趣模型的向量维数,并能避免分析标签语义的复杂过程,且能根据用户自身的理解来获取用户兴趣。最后将标签兴趣模型应用到推荐算法中。通过与经典的推荐算法进行比较,验证了该算法能有效缓解数据稀疏性、推荐冷启动问题,提升了推荐结果的准确性,能获得更好的推荐效果。 相似文献
5.
6.
7.
信息社会中在线百科已成为人们获取知识的重要途径,而在线百科的标签系统作为其重要组成部分,不仅可以帮助人们在浏览某张页面时获取其他相关页面的信息,而且对于海量文本分类,以及提高在线百科检索系统的检索效率都有很大帮助。充分利用在线百科页面间的链接关系,提出了一种基于页面间的同质性原理和向量空间模型的全新针对在线百科的标签推荐算法HVSM(homogeneous principle based vector space model)。该标签推荐算法具有普适性,可在不同在线百科系统间推荐标签。实验结果表明,通过与朴素推荐算法NAM(nave recomm endation model)进行比较,新的推荐算法可以达到更高的准确率。并且通过对实验数据进行分析,得到了若干有益的结论,为今后的研究工作奠定了基础。 相似文献
8.
重叠社区结构挖掘旨在发现复杂网络中多个独立社区之间的重叠部分,其在社交、交通、舆情乃至反恐等领域具有广泛的应用。然而,目前基于标签传播的重叠社区挖掘算法在社区结构模糊的网络中表现出较强的随机性,导致准确度不高。针对重叠社区模糊边界导致的不确定性和低准确度问题,提出一种融合特征向量中心性与标签熵的标签传播算法ECLE-LPA。ECLE-LPA通过融合节点的K-核迭代因子与特征向量中心性来计算节点影响力并初始化节点标签,在标签传播过程中,通过节点标签熵和节点间亲密度更新节点标签列表及其标签隶属度,从而较好地克服了社区模糊边界的识别问题。实验结果表明:在Les Miserables、Polbooks、Football、Polblogs和Netscience等真实网络中,ECLE-LPA划分结果的EQ值普遍比对比算法提高了1%~3%;在社区结构模糊的人工网络中,ECLE-LPA划分结果的NMI值比其他标签传播算法提高了10%以上。 相似文献
9.
针对空间数据集的特性,提出一种基于空间局部偏离因子(SLDF)的离群点检测算法。利用SLDF度量空间点对象的离群程度,计算空间数据集中点对象的SLDF值并对其进行排序,将取值较大的前M个点对象作为空间离群点。实验结果表明,该算法能较好地检测空间局部离群点,其有效性与准确性均优于SLZ算法,适用于高维大数据集的空间离群点检测。 相似文献
10.
贾佳 《计算机技术与发展》2012,22(6)
基于网格和密度的聚类算法是一类很重要的聚类算法,但由于采用单调性搜索的方法,使得聚类结果并不十分理想,因此文中在GDD算法的基础上,提出了一种基于网格和密度的带有层次因子与距离因子的GDLD算法.GDLD算法将数据空间按要求划分成网格结构并计算网格密度,构建新的跃迁函数以达到形成有效聚类的目的.实验证明,该算法不仅能够发现任意形状的簇,而且使效率得到了很大的提高.同时层次因子既体现了簇的密度水平,也反映了簇密度的变化过程并使得算法参数更容易确定. 相似文献
11.
图像中物体轮廓线的描述和辨识是图像理解的一个核心问题,提出了一种新的快速的轮廓线描述和匹配方法。该方法不是把曲线中的每一点都进行了描述和匹配,而是按照最小面积法则对曲线进行采样。用采样点与质心的距离增量为每一个采样点赋予一个身份向量,通过所有采样点的身份向量来构造曲线的质心距离增量矩阵以描述曲线,最后利用两条曲线的质心距离增量矩阵的差异度来度量它们的相似性。实验证明该描述方法不仅具有很好的唯一性,而且相比目前已有算法计算量大大减少。该方法的一个实际应用在于将一个地区的SAR图像与地图相匹配。 相似文献
12.
Finding centroid clusterings with entropy-based criteria 总被引:1,自引:3,他引:1
We investigate the following problem: Given a set of candidate clusterings for a common set of objects, find a centroid clustering that is most compatible to the input set. First, we propose a series of entropy-based distance functions for comparing various clusterings. Such functions enable us to directly select the local centroid from the candidate set. Second, we present two combining methods for the global centroid. The selected/combined centroid clustering is likely to be a good choice, i.e., top or middle ranked in terms of closeness to the true clustering. Finally, we evaluate their effectiveness on both artificial and real data sets. 相似文献
13.
无线传感器网络节点的定位算法 总被引:43,自引:0,他引:43
针对无线传感器网络节点定位问题进行了研究,提出了一种新的节点定位算法,介绍了算法的基本原理和实现方法。该算法不需要任何额外的硬件支持,节点间通信开销少。仿真实验显示,在网络迓接度为8、参考节点数量为20的情况下,平均定位误差小于节点射频通信距离的21%。 相似文献
14.
数据分组在转发过程中需要在其转发范围内寻找一个中继节点进行转发。为了降低转发过程中寻找中继节点的复杂程度,减少从源节点到达目的节点的平均跳数,提出了一种车载自组织网络中基于定向传播的自适应路由协议(Adaptive Routing Protocol Based on Directional Transmission,ARPBDT)。该路由协议有两个关键参数:转发角度和平均每跳前进距离。首先为了缩小转发范围,设置一个始终朝着目的节点方向的转发角度,以减少转发范围内的节点数以及寻找中继节点的计算量;其次为了减少平均跳数,在转发范围内根据前进距离自适应地选择较优或次优的邻居节点作为中继节点进行转发。仿真结果表明,与OBDR相比,所提路由协议的平均跳数较少,平均每跳前进距离较大,能够使数据分组快速地到达目的节点。 相似文献
15.
许燕青 《电脑编程技巧与维护》2010,(24):41-42
提出了一种基于平均距离的K-近邻分类改进算法,克服了K-近邻分类算法准确率不高的两个问题:一是各个类别的近邻个数相同时则无法判断测试样本的类别;二是即使某一类别的近邻个数较多,但由于此类别的近邻样本与测试样本的相似度都比较小,则有可能把测试样本错误地判断为此类别。 相似文献
16.
Web数据库快速开发工具的研究 总被引:1,自引:0,他引:1
网络技术和Web技术的快速发展,导致大量的应用向Web集成。但由于HTML提供的功能有限,在很多应用领域就需要进行对应的扩展。文章对几种常用的Web应用扩展的方法进行了比较。然后着重介绍了使用VisualC++进行ColdFusion扩展的方法。 相似文献
17.
18.
19.
The Cook's distance for generalized linear mixed models is investigated, with applications to clustered data. In particular, first-order approximations are derived for the best linear unbiased predictor of the parameters due to cluster deletion. A small-scale simulation study shows that the method provides an efficient way to identify influential clusters. The notion of joint and conditional influence is also considered to address the masking effects of cluster-wise deletion. A data set on maternity length of hospital stay illustrates the usefulness of the proposed diagnostics. 相似文献
20.
In this paper we aim to characterize graphs in terms of a structural measure of complexity. Our idea is to decompose a graph into layered substructures of increasing size, and then to measure the information content of these substructures. To locate dominant substructures within a graph, we commence by identifying a centroid vertex which has the minimum shortest path length variance to the remaining vertices. For each graph a family of centroid expansion subgraphs is derived from the centroid vertex in order to capture dominant structural characteristics of the graph. Since the centroid vertex is identified through a global analysis of the shortest path length distribution, the expansion subgraphs provide a fine representation of a graph structure. We then show how to characterize graphs using depth-based complexity traces. Here we explore two different strategies. The first strategy is to measure how the entropies on the centroid expansion subgraphs vary with the increasing size of the subgraphs. The second strategy is to measure how the entropy differences vary with the increasing size of the subgraphs. We perform graph classification in the principal component space of the complexity trace vectors. Experiments on graph datasets abstracted from some bioinformatics and computer vision databases demonstrate the effectiveness and efficiency of the proposed graph complexity traces. Our methods are competitive to state of the art methods. 相似文献