首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
为解决协同过滤算法中的数据稀疏性问题,提出了一种改进的协同过滤算法。该算法使用slope one算法计算出来的评分预测值来填充评分矩阵中的未评分项目,然后在填充后的用户-项目评分矩阵上通过基于用户的协同过滤方法给出推荐。利用slope one算法计算出来的评分预测值作为回填值,既能降低评分矩阵的稀疏性,也保证了回填值的多样性,从而减少均值、中值等单一填充值造成的推荐误差。在MovieLens-1M数据集上对本文改进算法和协同过滤算法及均值中心化处理的算法作五折交叉实验,结果表明,基于评分预测值填充数据后的协同过滤算法有效的缓解了数据稀疏性问题,并且有更好的推荐效果。  相似文献   

2.
基于Tag和协同过滤的混合推荐方法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对传统协同过滤方法的稀疏性问题,提出基于标签(Tag)和协同过滤的混合推荐方法TAG-CF。通过Tag分类信息获取项目的最近邻居,采用基于项目的最近邻方法预测用户评分值,并利用该预测值填充用户评分矩阵,构造密集的伪矩阵,运用基于用户的的协同过滤方法在伪矩阵上计算用户对项目的预测评分值。实验结果表明,TAG-CF能有效降低推荐系统的平均绝对误差,提高推荐质量。  相似文献   

3.
刘海洋  王志海  黄丹  孙艳歌 《软件学报》2015,26(11):2981-2993
协同过滤方法是当今大多数推荐系统的核心.传统的协同过滤方法专注于评分预测的准确性,然而实际推荐系统的推荐结果往往是项目的排序.针对这一问题,将排名学习领域的知识引入推荐算法,设计了一种基于评分矩阵局部低秩假设的成列协同排名算法.选择直接使用计算复杂度较低的成列损失函数来优化矩阵分解模型,并通过实验验证了其在运算速度上的显著提升.在3个实际推荐系统数据集上,与当下主流推荐算法的比较实验结果表明,该算法具有良好的性能.  相似文献   

4.
传统的基于协同过滤的推荐方法可以挖掘出评分中隐含的特征, 但推荐过程时间长, 且评分矩阵具有稀疏性, 导致样本真实值与预测值间误差较大. 神经网络通过批量训练可以较快计算出对象特征, 卷积神经网络的局部感知与参数共享性使参数个数明显缩减, 利用普通神经网络及卷积神经网络共同实现推荐可使计算时间缩短; 通过调整神经网络的参数, 为卷积神经网络设计合理的特征向量和卷积核大小, 可以提升推荐速度和推荐准确性. 实验表明, 使用神经网络结合卷积神经网络进行推荐的方法能使推荐的绝对误差均值下降至0.67以下, 大幅提升推荐的准确性及有效性.  相似文献   

5.
矩阵奇异值分解技术已经被广泛应用在个性化推荐系统之中。通过矩阵奇异值分解可以提高个性化推荐的准确度。传统的奇异值分解模型对整个矩阵进行分解,得到 user 和 item 两个特征矩阵,然后进行评分预测,并未考虑不同范围的评分包含的不同信息。通过计算评分中的临界值,把评分矩阵拆分成两个矩阵,称为正反馈矩阵和负反馈矩阵。再基于两个反馈矩阵的特征来完成对评分的预测。在实验数据方面,使用MovieLens的数据集,对传统的奇异值分解模型(SVD)和基于超图的奇异值分解模型(HSVD)进行改进。实验结果表明,引入偏好区分概念的模型PSVD、PHSVD,其推荐效果都优于原模型。  相似文献   

6.
在商业领域,推荐系统被广泛用于向用户推荐符合其个人偏好的产品、服务或内容。借助这一技术建立图书推荐系统可以有效提高图书馆的服务水平。所提出的图书推荐系统是使用协同过滤技术通过对具有相似阅读习惯读者的借书数据进行偏好评分计算,从而为指定读者推荐符合其偏好的图书列表。为了解决推荐系统中所存在的数据稀疏性、评分的系统偏差以及图书偏好的量化等问题,该研究采用了矩阵分解、在评分中引入偏差值以及使用带时间戳的借阅记录生成偏好量化数值等解决方法。实验结果表明该推荐系统具有较好的准确度。  相似文献   

7.
协同过滤推荐算法是目前应用最为广泛的个性化推荐方法之一,但传统的推荐算法在计算目标用户邻居集时只考虑用户项目评分矩阵中的具体数值,没有考虑用户偏好以及用户评分与项目属性之间的关系,推荐精度也有待进一步提高。针对这一问题,提出了一种基于用户偏好和项目属性的协同过滤推荐算法(UPPPCF)。本算法在传统的用户项目评分矩阵基础上综合考虑用户偏好以及项目属性,把评分矩阵转变成基于用户偏好的用户项目属性评分矩阵,然后根据这一评分矩阵来计算目标用户的最近邻居集,克服了传统相似性计算方法只依靠用户评分值的不足,同时本文对预测值判定给出了一种有效的度量方法。在 MovieLen 数据集上的实验结果表明,本文提出的UPPPCF算法能够有效弥补传统协同过滤算法中的不足,而且在推荐精度上有了明显的提高。  相似文献   

8.
推荐系统中的辅助信息可以为推荐提供有用的帮助,而传统的协同过滤算法在计算用户相似度时对辅助信息的利用率低,数据稀疏性大,导致推荐的精度偏低.针对这一问题,本文提出了一种融合用户偏好和多交互网络的协同过滤算法(NIAP-CF).该算法首先根据评分矩阵和项目属性特征矩阵挖掘出用户的项目属性偏好信息,然后使用SBM方法计算用户间的项目属性偏好相似度,并用其改进用户相似度计算公式.在进行评分预测时,构建融合用户-项目属性偏好信息的多交互神经网络预测模型,使用动态权衡参数综合由用户相似度计算出的预测评分和模型的预测评分来进行项目推荐.本文使用MovieLens数据集进行实验验证,实验结果表明改进算法能够提高推荐的精度,降低评分预测的MAE和RMSE值.  相似文献   

9.
为了解决协同过滤算法中数据稀疏性问题,提高推荐效果,提出一种改进的协同过滤算法.该算法首先通过一种新的相似度计算方法来计算项目类型相似度,将相似度大于某阈值的项目作为目标项目的邻居;然后根据目标用户对邻居项目的评分信息来预测该用户对目标项目的评分值,并将预测值填入稀疏的用户项目评分矩阵;最后对填充后的评分矩阵采用基于用户聚类(K-means聚类)的协同过滤算法做出最终的预测评分进行推荐.在Movielens数据集上进行实验验证,结果表明该算法能够很好地缓解数据稀疏性、降低计算复杂度,提高推荐精度.  相似文献   

10.
李慧  胡云  施珺 《计算机应用》2013,33(11):3067-3070
针对传统协同过滤推荐算法的数据稀疏性及恶意评分等问题,提出了一种融合信任度与矩阵分解技术实现社会网络推荐的方法。首先通过计算节点的声望值与偏见值发现网络中的不可信节点,并将其评分权重进行弱化。然后将用户-评分矩阵与信任度矩阵相结合,实现社会网络环境下的协同推荐。实验表明,相对于传统的协同过滤算法,该算法可以消减虚假评分或恶意评分给推荐系统带来的负面影响,有效地缓解数据稀疏性与冷启动问题,显著提高推荐系统的推荐质量。  相似文献   

11.
In this paper, we aim to develop computational intelligence approaches for wind profile prediction. Specifically, we focus on two aspects in this work. First, we investigate the missing value recovery for wind data. Due to the complexity of data collection in such processes, wind data normally include missing values. Therefore, how to effectively recover such missing values for learning and prediction is an important aspect for wind profile prediction. Second, we develop an ensemble learning approach based on multiple neural network models. Our proposed method uses a new strategy based on the temporal information to assign the weights for each model dedicated for wind profile prediction to achieve better prediction performance. Various simulation studies and statistical testing demonstrate the effectiveness of our approach.  相似文献   

12.
数据缺失在电力负荷数据采集过程中经常发生,对提高算法的预测精确度带来了不利影响.现有的缺失数据补全算法只适用于缺失数据量较少的情况,而对于缺失数据较多的情况表现不佳.面对严重数据缺失的挑战,文中提出了一种基于稀疏表示的电力负荷缺失数据补全方法.首先以数据随机缺失为前提,将训练数据中假定缺失后的数据与完整的训练数据上下拼...  相似文献   

13.
This paper proposes a new approach based on missing value pattern discovery for classifying incomplete data. This approach is particularly designed for classification of datasets with a small number of samples and a high percentage of missing values where available missing value treatment approaches do not usually work well. Based on the pattern of the missing values, the proposed approach finds subsets of samples for which most of the features are available and trains a classifier for each subset. Then, it combines the outputs of the classifiers. Subset selection is translated into a clustering problem, allowing derivation of a mathematical framework for it. A trade off is established between the computational complexity (number of subsets) and the accuracy of the overall classifier. To deal with this trade off, a numerical criterion is proposed for the prediction of the overall performance. The proposed method is applied to seven datasets from the popular University of California, Irvine data mining archive and an epilepsy dataset from Henry Ford Hospital, Detroit, Michigan (total of eight datasets). Experimental results show that classification accuracy of the proposed method is superior to those of the widely used multiple imputations method and four other methods. They also show that the level of superiority depends on the pattern and percentage of missing values.  相似文献   

14.
序列缺失数据的灰插值推理方法   总被引:2,自引:0,他引:2  
根据灰色系统理论和序列数据的特性,提出一种灰插值方法.建立前向灰预测和后向灰预测模型,充分利用缺失值时区窗口内的全部信息对其进行推理.分别在单序列时建立递进灰拟合模型,在多维数据集时利用属性相关性,对括值结果进行学习优化.通过与常用插值方法的比较实验表明。该方法具有较好的光滑性和预测效果.  相似文献   

15.
Link prediction has attracted wide attention among interdisciplinary researchers as an important issue in complex network. It aims to predict the missing links in current networks and new links that will appear in future networks. Despite the presence of missing links in the target network of link prediction studies, the network it processes remains macroscopically as a large connected graph. However, the complexity of the real world makes the complex networks abstracted from real systems often contain many isolated nodes. This phenomenon leads to existing link prediction methods not to efficiently implement the prediction of missing edges on isolated nodes. Therefore, the cold-start link prediction is favored as one of the most valuable subproblems of traditional link prediction. However, due to the loss of many links in the observation network, the topological information available for completing the link prediction task is extremely scarce. This presents a severe challenge for the study of cold-start link prediction. Therefore, how to mine and fuse more available non-topological information from observed network becomes the key point to solve the problem of cold-start link prediction. In this paper, we propose a framework for solving the cold-start link prediction problem, a joint-weighted symmetric nonnegative matrix factorization model fusing graph regularization information, based on low-rank approximation algorithms in the field of machine learning. First, the nonlinear features in high-dimensional space of node attributes are captured by the designed graph regularization term. Second, using a weighted matrix, we associate the attribute similarity and first order structure information of nodes and constrain each other. Finally, a unified framework for implementing cold-start link prediction is constructed by using a symmetric nonnegative matrix factorization model to integrate the multiple information extracted together. Extensive experimental validation on five real networks with attributes shows that the proposed model has very good predictive performance when predicting missing edges of isolated nodes.  相似文献   

16.
This paper proposes a grey-based nearest neighbor approach to predict accurately missing attribute values. First, grey relational analysis is employed to determine the nearest neighbors of an instance with missing attribute values. Accordingly, the known attribute values derived from these nearest neighbors are used to infer those missing values. Two datasets were used to demonstrate the performance of the proposed method. Experimental results show that our method outperforms both multiple imputation and mean substitution. Moreover, the proposed method was evaluated using five classification problems with incomplete data. Experimental results indicate that the accuracy of classification is maintained or even increased when the proposed method is applied for missing attribute value prediction.  相似文献   

17.
采用光纤传感器监测的光纤频移值对矿压显现规律进行表征的过程中,传感器采集的数据存在缺失现象,无法准确预测矿压显现规律。针对该问题,以千秋煤矿为工程背景,在假设光纤下半部分数据丢失的前提下,引入GRU(门控循环单元)和LSTM(长短期记忆网络)2种预测模型,对缺失的光纤频移值进行对比预测,得出GRU模型的收敛速度优于LSTM模型的收敛速度,说明基于GRU模型的缺失值处理方法较优。将原始完整的光纤频移值转换为可表征矿压显现位置的光纤平均频移变化度,引入XGBoost(极端梯度提升)模型和BP神经网络模型进行对比预测,XGBoost模型能准确预测出测试集中所有出现“尖峰”的位置,而BP神经网络模型只预测出2处“尖峰”位置,说明XGBoost模型的预测效果优于BP神经网络模型的预测效果。将预测出的光纤频移缺失值替换至缺失位置,形成“完整”光纤频移值数据,将该数据转换为光纤平均频移变化度后,采用XGBoost模型进行预测。验证结果表明:LSTM模型及GRU模型均可准确预测出光纤下半部分的数据,且GRU模型准确性较LSTM模型准确性高;使用XGBoost可准确预测出测试集中出现的周期来压;通过GRU模型预测出的缺失数据经整合至缺失位置后,使用XGBoost模型仍可进行有效的矿压预测。  相似文献   

18.
针对数据连续缺失情况下交通流预测精度下降甚至失效的问题,提出了一种时空卷积神经网络预测模型,根据横向分布的时间相关性和纵向分布的空间相关性,构建路网交通数据时空矩阵,引入掩码矩阵标记数据的缺失状况,利用卷积操作提取路网中各检测器之间隐含的非线性关联,建立当前时刻与未来交通状态的映射关系,实现数据缺失情况下的交通流预测....  相似文献   

19.
在线鲁棒随机权神经网络(OR-RVFLN)具有较好的逼近性、较快的收敛速度、较高的鲁棒性能以及较小的存储空间.但是, OR-RVFLN算法计算过程中会产生矩阵的不适定问题,使得隐含层输出矩阵的精度较低.针对这个问题,本文提出了奇异值分解下在线鲁棒正则化随机网络(SVD-OR-RRVFLN).该算法在OR-RVFLN算法的基础上,将正则化项引入到权值的估计中,并且对隐含层输出矩阵进行奇异值分解;同时采用核密度估计(KDE)法,对整个SVD-OR-RRVFLN网络的权值矩阵进行更新,并分析了所提算法的必要性和收敛性.最后,将所提的方法应用于Benchmark数据集和磨矿粒度的指标预测中,实验结果证实了该算法不仅可以有效地提高模型的预测精度和鲁棒性能,而且具有更快的训练速度.  相似文献   

20.
为发掘卷积神经网络在协同过滤预测中的潜力,针对神经自回归模型方法和支持向量机在深度学习中的优势,提出基于深度神经向量机自回归的协同过滤方法。通过将神经网络最后一层的激发函数替换为线性支持向量回归函数的方式,学习基于最小边缘的对数损失。在多个公开数据集上的实验结果表明,该算法在深度神经自回归对协同过滤问题实现较好预测的基础上,线性向量回归函数的使用能更好地提升预测效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号