首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
为更全面地反映用户个人偏好,提高推荐的准确度,提出了一种融合多源异构数据的混合推荐模型.综合考虑了用户社交关系和用户评论对用户评分的影响,从评论中提取主题信息作为用户和商家的特征,采用社区发现算法为用户划分社区,利用机器学习方法为社区建立模型,预测用户对商家的评分,再根据评分对商家进行排序,取前N个商家推荐给用户.实验结果表明,提出的混合推荐模型与经典推荐算法相比,可提高评分预测的准确度,从而提高推荐的准确度.  相似文献   

2.
传统聚类算法无法实时处理足球运动员跑动产生的动态增量数据,为此提出一种基于簇特征的大规模跑动数据聚类算法。利用k-means算法对初始数据进行聚类,并保留聚类后各簇特征,当跑动过程产生的增量数据到来时,利用表示原始簇信息的簇特征与增量数据进行增量聚类,避免传统算法因需重新聚类而导致耗时过长的问题。针对k-means算法容易产生概念偏移的现象,利用簇特征快速检测,避免聚类结果不一致。实验结果表明,该算法能快速处理动态增量数据,且聚类结果一致。  相似文献   

3.
随着移动服务的发展,越来越多的移动端服务基于对象的位置进行推送和推荐,因此位置预测技术显得越来越重要.由于对象位置信息存在采集不连续或对象行为不规律等因素,导致位置预测成为一项非常有挑战的工作.为了提高位置预测的准确性,提出一种基于K-Means算法和时间匹配的位置预测模型.该模型使用K-Means算法对历史位置点进行聚类,划分多个对象运动区域,针对对象运动区域进行预测.按照对象的作息时间将一天时间划分为多个时间段,运用笔者提出的轨迹建模算法和轨迹更新算法形成用户运动轨迹,形成对象运动轨迹,再使用时间匹配原则进行位置预测.笔者最后利用真实的数据实现该模型,实验证明:未使用该模型的位置预测准确率为39.7%;使用该模型后算法和时间匹配的位置预测模型预测准确率达到60.3%,准确率提高了20%左右.  相似文献   

4.
提出了将社交类服务中的两类极为重要的数据--社交网络结构数据和用户所发布的文本内容数据相结合的动态兴趣识别方法.首先通过定义时间窗口,对社交网络用户的实时文本信息进行主题建模,识别用户实时兴趣概率特征;然后将微观网络结构信息与用户好友的兴趣信息相结合,构建预测特征;最后,建立逻辑回归、支持向量机等分类器,采用所构建的预测特征对用户兴趣进行动态预测.在新浪微博中的应用表明,该方法具备一定的有效性.  相似文献   

5.
针对BP神经网络由于随机初始化权重和偏置导致对用电情况预测的误差偏大且容易陷入局部最优的问题,提出了一种利用萤火虫算法对BP神经网络的权重和偏置进行优化的电力用能行为预测方法.该方法基于用户不同时间段的用电量数据提取时间序列特征,并采用K-means聚类算法对用电行为类似的用户进行聚合及分析,从而建立电力负荷预测模型对每类用户的负荷加以预测.实验结果表明,基于萤火虫算法改进BP神经网络预测模型的均方根误差以及平均绝对误差百分比均低于BP神经网络模型,能够合理地对电力用能行为进行预测.  相似文献   

6.
为了实现在网络资源中为网络用户提供针对兴趣爱好的推荐项目,提出了一种基于K-means聚类的应用于动态多维社会网络的个性化推荐算法.首先根据用户评分数据对用户进行建模,并根据评分数据集构建多维用户网络,再加入局域世界演化理论形成动态多维网络;然后根据改进的K-means算法对用户聚类;最后根据最近邻居得到目标用户的预测评分作出推荐,从而形成一种应用于动态多维社会网络中的个性化推荐算法.实验表明,相比协同过滤个性化推荐系统,新推荐策略的预测值和真实值之间的误差较小,个性化推荐水平得到了一定程度的提高.  相似文献   

7.
为结合参数模型与非参数模型各自的优势,提高建模精度,将非线性半参数模型引入到工业过程建模中.提出基于遗传算法和神经网络的非线性半参数模型的建模方法及结构方案,并给出同时估计参数模型部分和非参数模型部分的交叉循环迭代的算法步骤.对算法中的神经网络的设计和遗传算法进行了改进研究,重点讨论了在增加精英保留策略、增加算法的记忆功能、提出新的适应度计算方法和交叉变异策略等方面的改进措施.采用聚乙烯装置的现场工业数据对方法的有效性进行了验证.结果表明:半参数模型比传统的参数模型有更好的预测精度,并能够较好地跟踪过程变化.  相似文献   

8.
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个平衡的训练数据子集;然后使用改进的遗传算法对训练数据集进行降维,得到多个具有最优特征的训练数据子集;使用极端梯度算法(XGBoost)作为分类器,训练多个平衡数据子集,用简单投票法对多个分类器进行集成,得到新的分类器;最后对测试集进行预测,得到最终预测结果.实验结果表明,提出算法的分类结果与XGBoost的结果相比,准确率提高了约19.25%,且减少了建立学习模型的时间,提高了分类性能,是一种较好的分类算法.  相似文献   

9.
目前,对微博转发行为预测主要是对所有微博用户的历史数据进行学习,从而得到转发模型.但是这类模型需要对所有用户的转发行为进行全局预测,存在同质性且无法对具体用户进行个性化预测的缺陷.针对这些问题,提出了基于多任务学习的个性化微博转发行为预测算法.对新浪微博进行了数据抓取、分析和特征选择,根据社会学中影响力的理论,针对微博用户之间进行社交信息交流而导致相互影响的特点,引入了多任务学习方法,以逻辑回归预测模型作为基准算法,将预测模型分为全局模型与个性模型进行学习.预测模型把对每个用户转发行为的预测对应为多个任务,根据微博用户间的社交交互对这些任务进行关联.实验结果表明,所提出的模型能够有效地对单个用户的微博转发行为进行预测,并且提高了转发行为预测的准确率.  相似文献   

10.
针对在线网络信息内容安全事件的分类问题,利用网络用户通信信息中含有的时间、关系和内容特征均可基于文本描述的特点,引入LDA模型,提出了一种实时多维信息联合(RMIA-LDA)的在线信息内容安全事件分类模型及算法。以网络通信中的时间特征为轴,对由此划分出的各个时间片段中的通信关系、通信内容特征采用LDA模型进行建模分类,对分类结果的相似性进行度量后,再与增量更新数据部分的分类结果归纳合并,从而得到当前实时在线数据中的事件分类。仿真实验结果表明,该模型和算法可以有效实现网络中信息内容安全事件的在线分类,较现有算法具有优越的性能。  相似文献   

11.
针对全局建模方法很难精确描述实际生产过程,提出了一种模糊支持向量机回归建模算法,并推导出相应的增量与减量算法;在此基础上,提出了在线模糊支持向量机回归建模方法,该方法利用滚动时间窗内的数据优化建模,随着时间窗的滚动,在原有模糊支持向量机模型的基础上通过增量与减量算法实现参数的快速在线更新。通过将该方法用于丙烯腈收率的预测建模,结果表明,所提方法具有参数调整时间快、泛化能力强的优点,可以较好的跟踪丙烯腈收率的变化。  相似文献   

12.
针对单一预测模型不能完全反映电力负荷的变化规律和信息的问题,构造了组合NN预测模型,该模型由基于附加动量算法的AM-NN子模型和基于拟牛顿算法的QN-NN子模型构成,通过时变综合权系数将两个模型融合在一起,将气象因素数据引入到模型中,采用滚动优化策略,使模型具有较好的泛化性和收敛性。通过对实际电网负荷的预测仿真和测试,证实所提出的组合NN预测模型能有效提高预测精度,平均绝对误差和最大相对误差分别达到了1.84%和5.77%,将其作为实际电网短期负荷预测软件的预测子模块,能满足实际的调度预测要求。  相似文献   

13.
针对协同过滤推荐系统应用中存在的数据稀疏、可扩展性受限等问题,提出了一种基于用户聚类的二分图网络协同推荐算法.该算法在用户聚类阶段对二分图网络进行用户中心聚类,并获取用户聚类中心及其所在的群组,基于用户群组的评价信息为目标用户提供更广泛的推荐数据;在协同推荐阶段,围绕聚类中心及其所在群组为未评分项目完成预测评分,为用户推荐综合评分最高的Top-n项目.结果表明,该算法能够提升目标用户推荐的准确度,并能改善协同推荐的多样性.  相似文献   

14.
针对浆纱过程产生的实时动态数据,提出一种基于增量学习的在线软测量建模方法,实现对上浆率的预测.将增量学习的思想引入软测量算法,去除冗余数据,提高算法效率;使用改进式山峰算法确定数据中心,通过自适应方法确定去噪半径,完成对噪声数据的筛选;选取软测量算法进行建模.实验所用数据采集自真实浆纱过程.仿真结果表明:该算法预测精度较高,具有一定的抗噪性能,均方根误差最小可达0.263 3,最大绝对误差最小为0.633 1,适用于多种智能算法的在线更新.  相似文献   

15.
针对化工过程灰箱建模存在的精确度差、速度慢、计算复杂度高等问题,对现行模糊C-均值聚类算法进行了改进,提出了一种快速全局优化的(用于建模的数据训练集)模糊聚类算法.该算法具有不依赖初始条件、收敛速度快等特点.实验结果表明,利用快速全局优化模糊聚类算法得到的数据,在灰色预测的时间和数据准确性方面都有了显著提高,计算机仿真实验表明了该算法的有效性.  相似文献   

16.
针对流程工业多工况、非线性特性所导致的建模困难问题,提出一种基于模型参数聚类的预测建模方法.结合员工操作、环境变化以及数据特征等因素选择涵盖多种工况的典型历史数据;根据典型历史数据,利用受限最小二乘法,分段建立多个脉冲响应模型;以各模型参数为特征,采用K-均值方法对各分段模型进行子空间聚类,生成K类聚类模型;在实际控制阶段,根据校正预测效果选择合适的聚类模型,并采用该模型进行实时控制.研究结果表明:该聚类建模方法能反映分解炉的运行状态,预测效果好,鲁棒性强,能够适应多种工况;应用该模型对分解炉温度进行实时控制可获得满意的效果.  相似文献   

17.
提出了一种加权的基于LDA(Latent Dirichlet Allocation)的协同过滤算法,通过对传统协同过滤算法优缺点的分析,联合打分数据和评论数据的特征进行推荐。该算法主要研究用户评论文本的特点,通过LDA主题模型对评论文本集合进行主题提取,使用相对熵的方法计算相似度,在此基础上,研究用户评分对于每条评论文本的影响,联合LDA进行评分预测及推荐。实验结果表明,该算法能够显著提高推荐准确度。  相似文献   

18.
针对依靠单一算法训练互联网用户行为数据构建的贝叶斯网络(Bayesian Network, BN)计算耗时长、结构不稳定等问题,提出加权概率融合并行贝叶斯网络增量学习(WPFPBayes)算法。该算法根据自适应数据切片算法找出最优数据片尺寸,快速进行并行BN模型训练;将数据切片上学习得到的若干子BN结构通过融合加权概率方法合并成一个全局BN模型;通过一种增量评分函数定量表示单位时间内网络模型与数据之间适应程度的变化情况;采用依据特定结点进行BN更新的措施达到新旧数据在网络中的平衡。仿真实验结果表明:WPFPBayes算法下得出的BN模型的效率及其准确率均高于其他常见算法;随着数据量的增加,BN模型数据表达的准确率和稳定性均得到提高,可以更有效检测网络用户的异常行为。  相似文献   

19.
窃电行为检测的主要目的 在于发现窃电用户,降低电力系统运营成本.在此背景下,提出基于改进模糊C均值聚类的窃电行为检测模型,包括因子分析、基于改进模糊C均值聚类的局部离群因子计算、ROC曲线模型评价与调参及最佳检测阈值选取等模块,适用于无大量已知窃电用户样本的情况.首先,通过因子分析对用户用电特征(包括用电负荷数据和电能表异常事件)进行维度规约,提升模型检测效率.再利用遗传模拟退火算法对模糊C均值聚类算法进行改进,对用户用电特征进行检测.最后与现有成熟算法进行比较,验证该模型对窃电行为具有较高的检测准确度.检测模型可输出所有被测用户用电行为离群度得分和窃电概率排序,利用该文检测模型的输出,能够以较高精度检测出窃电行为用户,根据结果进行现场稽查,可提升反窃电工作效率.  相似文献   

20.
针对协同过滤推荐算法的数据稀疏性和可扩展性问题,提出一种基于Logistic函数和用户聚类的协同过滤算法.计算用户对服务关键词的偏好度,构建用户-关键词偏好向量,并基于此向量对用户进行聚类;采用Logistic函数计算用户对服务的兴趣度,并根据兴趣度相似性在目标用户所在类内寻找其最近邻居;通过最近邻居预测用户对服务的兴趣度,将兴趣度较高的服务推荐给用户.基于真实数据集的实验证明,与传统协同过滤算法相比,本文算法能取得更高的准确率,且聚类后算法运行时间显著减少,有效地提高了推荐的实时性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号