首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对现阶段医疗领域的用户画像研究方法存在数据收集模式单一、对数据分析力度不够和对知识的融合较差导致构建的用户画像维度单一、精准度较低的问题,提出一种基于多视角、多维度的药店会员用户画像的构建方法.分别从传统的消费视角和医药视角,从用户基本属性、用户社会属性、用户行为属性、用户消费属性、用户价值属性、用户生命周期属性和用...  相似文献   

2.
为改变用户画像技术在电力企业中推广难、收效低的现状,提出了一种基于改进的萤火虫优化加权K-means算法的分层聚类的画像推荐模型.该模型在用户画像构建时,为提高计算速度和精度,仅就单项业务设计标签模型,通过分层聚类着重构建特征群体画像;在画像应用时,直接向目标群体潜力用户推荐该项具体业务和其它新业务.在高压电力用户样本集上进行了仿真实验,表明分层聚类画像推荐模型能有效提升聚类和画像构建应用的精准性和运算速度,有助于画像技术在电力企业得到推广应用.  相似文献   

3.
传统方法对各类标签的聚类效果较差,导致模型生成的任务画像字段过短,因此构建基于互联网智能人单合一技术的任务画像算法模型。根据建立的互联网标签与用户标签,采用共现分析法进行标签聚类;基于互联网智能人单合一技术设置画像体系生成任务画像,使用BP神经网络算法建立任务画像算法模型。实验结果表明:与两种传统算法模型相比,此次构建的任务画像算法模型的SC值评价指数更好,标签聚类效果更佳,任务画像生成的数据字段片段可以详细描述员工任务现状。  相似文献   

4.
一种用于构建用户画像的二级融合算法框架   总被引:1,自引:0,他引:1  
用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴“标签”。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级模型中,分别在各个标签预测子任务上建立多种模型,使用传统机器学习方法与Trigram特征相结合来抽取用户用词习惯的差异,使用doc2vec浅层神经网络模型来抽取查询词的语义关联信息,使用卷积神经网络模型来抽取查询词之间的深层语义关联信息。实验表明,doc2vec在处理用户查询这样的短文本相关任务时有着相对较好的预测准确性。在第二级模型中,针对用户画像这样的多标签预测任务,使用XGBTree模型及Stacking多模型相融合的方法提取出用户各标签属性之间的关联信息,使得平均预测准确率进一步提高了2%左右。在2016年中国计算机学会(CCF)组织的大数据竞赛《大数据精准营销中搜狗用户画像挖掘》中,所提二级融合算法框架在894支队伍中夺得了冠军。  相似文献   

5.
针对药品销售行业传统低效营销方式的缺点,将药店睡眠会员是否容易被唤醒的问题抽象为二分类问题,提出了一种面向药店平台的预测睡眠会员唤醒算法,来解决现有睡眠会员唤醒模型应用于药店睡眠会员用户唤醒的局限性且预测用户到店消费精度不高的问题。从会员的行为、属性、动态三个维度提出多种传统营销特征属性,在多视角的基础上,设计出药品营销的独有特征属性构建出特征集合,将特征集合代入到支持向量机SVM以及XGBoost算法模型并使用Soft Voting方法进行模型融合。通过实验表明,相对于使用传统特征的单一模型,使用集成学习提取的特征集合所训练的融合模型的precision高出4%左右,recall高出5%左右,AUC值提升了15%左右,由此可知,基于特征选择与模型融合的睡眠会员唤醒算法具有更好的唤醒效果。  相似文献   

6.
基于多数据源融合挖掘用户的属性特征,为企业开展个性化推荐和精准营销提供了思路和参考.论文以构建多维用户画像为目标,提出了融合多数据源的用户画像构建方法.首先,基于改进的k-means聚类算法针对搜索记录数据和京东评论数据分别建立了用户兴趣特征标签库和用户消费特性标签库;其次,利用word2vec词向量进行相似度计算来获...  相似文献   

7.
一种有效的用于数据挖掘的动态概念聚类算法   总被引:11,自引:0,他引:11  
郭建生  赵奕  施鹏飞 《软件学报》2001,12(4):582-591
概念聚类适用于领域知识不完整或领域知识缺乏时的数据挖掘任务.定义了一种基于语义的距离判定函数,结合领域知识对连续属性值进行概念化处理,对于用分类属性和数值属性混合描述数据对象的情况,提出了一种动态概念聚类算法DDCA(domain-baseddynamicclusteringalgorithm).该算法能够自动确定聚类数目,依据聚类内部属性值的频繁程度修正聚类中心,通过概念归纳处理,用概念合取表达式解释聚类输出.研究表明,基于语义距离判定函数和基于领域知识的动态概念聚类的算法DDCA是有效的.  相似文献   

8.
为了解决电力潜在敏感用户画像聚类和识别结果准确度较低的问题,提出一种基于遗传优化神经网络的电力潜在敏感用户画像聚类算法。构建电力用户画像,精准刻画电力用户行为;选取电力用户画像的数值、时间、统计及聚类四种特征作为卷积神经网络模型的输入,识别电力潜在敏感用户画像;采用改进遗传算法优化卷积神经网络,使得识别结果更为精准。实验结果表明,该方法能够聚类、识别电力潜在敏感用户画像,且聚类和识别的性能及准确度较好。  相似文献   

9.
一种高效的属性图聚类方法   总被引:1,自引:0,他引:1  
吴烨  钟志农  熊伟  陈荦  景宁 《计算机学报》2013,36(8):1704-1713
图是描述现实世界各类复杂系统的一种普适模型,且许多实际应用中的图是大规模的.图的聚类是理解、分析和可视化大规模图的关键技术之一.现实世界的图往往包含丰富的属性信息,如何综合结构和属性信息进行属性图的聚类是一个新的挑战.大多数的现有方法或者将结构和属性转化为距离,基于传统方法进行聚类;或者只考虑某一方面聚类.文中结合信息论中最小长度原则,基于遗传算法,提出一种高效的属性图聚类方法GA-AGC.通过对属性图聚类问题建模,转化为最小描述长度原则问题;扩展标签传播方法作为遗传算法初始化方法,结合编码减小的局部变异方法,提出一种解决属性图聚类的遗传算法.文中方法无需设定聚类的数目,算法复杂度近似线性于结点和边的数目.真实数据集上的实验验证了算法的有效性和高效性.  相似文献   

10.
张恩  李会敏  常键 《计算机应用》2021,41(2):413-421
针对现有云外包隐私保护k-means聚类方案存在的效率不高,以及当云服务器不可信或遭受黑客攻击时返回不合理聚类结果的问题,提出了一种可应用于多方隐私保护场景的云外包可验证隐私保护k-means聚类方案。首先,提出了一种适用于云外包场景的改进的聚类初始化方法,从而有效提高算法的迭代效率;然后,利用乘法三元组技术来设计安全欧几里得距离的计算,并利用混淆电路技术来设计安全计算最小值算法;最后,提出了一种验证算法,使用户仅需一轮通信就实现对聚类结果的验证,并且数据外包后算法的训练完全在云上进行,能够有效减少用户和云的交互。仿真实验表明,所提方案在数据集Synthetic和S1上的准确度分别达到97%和93%,说明隐私保护下的k-means聚类和明文k-means聚类的情况近似,适用于医疗、社会科学和商业等领域。  相似文献   

11.
In dyadic prediction, the input consists of a pair of items (a dyad), and the goal is to predict the value of an observation related to the dyad. Special cases of dyadic prediction include collaborative filtering, where the goal is to predict ratings associated with (user, movie) pairs, and link prediction, where the goal is to predict the presence or absence of an edge between two nodes in a graph. In this paper, we study the problem of predicting labels associated with dyad members. Special cases of this problem include predicting characteristics of users in a collaborative filtering scenario, and predicting the label of a node in a graph, which is a task sometimes called within-network classification or relational learning. This paper shows how to extend a recent dyadic prediction method to predict labels for nodes and labels for edges simultaneously. The new method learns latent features within a log-linear model in a supervised way, to maximize predictive accuracy for both dyad observations and item labels. We compare the new approach to existing methods for within-network classification, both experimentally and analytically. The experiments show, surprisingly, that learning latent features in an unsupervised way is superior for some applications to learning them in a supervised way.  相似文献   

12.
Interpersonal relation defines the association, e.g., warm, friendliness, and dominance, between two or more people. We investigate if such fine-grained and high-level relation traits can be characterized and quantified from face images in the wild. We address this challenging problem by first studying a deep network architecture for robust recognition of facial expressions. Unlike existing models that typically learn from facial expression labels alone, we devise an effective multitask network that is capable of learning from rich auxiliary attributes such as gender, age, and head pose, beyond just facial expression data. While conventional supervised training requires datasets with complete labels (e.g., all samples must be labeled with gender, age, and expression), we show that this requirement can be relaxed via a novel attribute propagation method. The approach further allows us to leverage the inherent correspondences between heterogeneous attribute sources despite the disparate distributions of different datasets. With the network we demonstrate state-of-the-art results on existing facial expression recognition benchmarks. To predict inter-personal relation, we use the expression recognition network as branches for a Siamese model. Extensive experiments show that our model is capable of mining mutual context of faces for accurate fine-grained interpersonal prediction.  相似文献   

13.
高珊  袁宛竹  卢卫  王兰  张静  杜小勇 《软件学报》2023,34(3):1010-1026
政务数据治理正在经历从“物理数据汇聚”到“逻辑语义汇通”的新阶段.逻辑语义汇通是指针对各孤岛政务系统因长期“自治”而形成的元数据缺失、元数据同名不同义以及同义不同名等问题,在不重建或修改原系统代码以及不物理汇聚各政务数据的前提下,通过技术手段,统一各孤岛信息系统元数据的语义表达,实现元数据的语义互联互通.该工作是将各孤岛信息系统的元数据语义对齐到已有的标准元数据上,具体地,将标准元数据名称看作语义标签,对孤岛关系数据的列投影进行语义识别,从而建立列名和标准元数据的语义对齐,实现孤岛元数据标准化治理.已有基于列投影的语义识别技术无法捕捉到关系数据的列顺序无关性特征以及属性语义标签之间的相关性特征,针对这一问题,提出了基于预测阶段和纠错阶段的两阶段模型:在预测阶段,提出了共现属性交互的CAI模型(co-occurrence-attribute-interactionmodel),利用并行化的自注意力机制保证列顺序无关的共现属性交互;在纠错阶段,结合语义标签之间的共现性,通过引入纠错机制(correction mechanism),优化CAI模型预测结果.在政务基准数据和Magellan等多...  相似文献   

14.
角色分析可以满足产品个性化设计系统中对于用户模型构建的需要。提出了基于粗集的模糊聚类角色分析与模型构建方法,通过构造基于粗集的模糊相似矩阵、确定角色属性的模糊相似聚类分析方法,从用户调研数据中提取典型用户属性特征,构建角色模型。该方法完善了角色分析在产品设计中的应用方法,有助于快速生成概念产品设计模型与方案。  相似文献   

15.
社区矫正人员的规范管理技术平台目前正处于研究阶段,由于实际数据的缺乏,用于构建用户画像的社区矫正人员用户标签生成准确性不够。故本文基于改进的Stacking模型融合算法,对某市司法局的社矫人员数据进行清洗、整理以及特征选择后,进行建模分析,进而得出社矫人员“认罪伏法态度”“对社会的心态”“心理健康状况”“矫正惩戒情况”4个标签的预测结果。通过将预测结果与实验结果对比,得到预测准确率,从而表明Stacking模型融合方法对社区矫正人员用户标签的生成具体有效性和准确性。  相似文献   

16.
Currently, most of the existing recommendation methods treat social network users equally, which assume that the effect of recommendation on a user is decided by the user’s own preferences and social influence. However, a user’s own knowledge in a field has not been considered. In other words, to what extent does a user accept recommendations in social networks need to consider the user’s own knowledge or expertise in the field. In this paper, we propose a novel matrix factorization recommendation algorithm based on integrating social network information such as trust relationships, rating information of users and users’ own knowledge. Specifically, since we cannot directly measure a user’s knowledge in the field, we first use a user’s status in a social network to indicate a user’s knowledge in a field, and users’ status is inferred from the distributions of users’ ratings and followers across fields or the structure of domain-specific social network. Then, we model the final rating of decision-making as a linear combination of the user’s own preferences, social influence and user’s own knowledge. Experimental results on real world data sets show that our proposed approach generally outperforms the state-of-the-art recommendation algorithms that do not consider the knowledge level difference between the users.  相似文献   

17.
Crowdsourcing provides an effective and low-cost way to collect labels from crowd workers. Due to the lack of professional knowledge, the quality of crowdsourced labels is relatively low. A common approach to addressing this issue is to collect multiple labels for each instance from different crowd workers and then a label integration method is used to infer its true label. However, to our knowledge, almost all existing label integration methods merely make use of the original attribute information and do not pay attention to the quality of the multiple noisy label set of each instance. To solve these issues, this paper proposes a novel three-stage label integration method called attribute augmentation-based label integration (AALI). In the first stage, we design an attribute augmentation method to enrich the original attribute space. In the second stage, we develop a filter to single out reliable instances with high-quality multiple noisy label sets. In the third stage, we use majority voting to initialize integrated labels of reliable instances and then use cross-validation to build multiple component classifiers on reliable instances to predict all instances. Experimental results on simulated and real-world crowdsourced datasets demonstrate that AALI outperforms all the other state-of-the-art competitors.  相似文献   

18.
随着移动互联网的广泛普及,国内网络游戏市场日趋饱和,游戏公司获得新用户的成本不断增加,如何预防存量用户的流失已经成为市场营销的重心。提出了一种基于Spark平台的网络游戏用户流失预测方法,基于一个真实游戏日志数据对用户进行了流失预测。首先,从日志数据中抽取和计算了用户特征;随后,按权重选取了一组重要特征;最后,以特征为输入、流失与否为输出进行了二分类建模。综合比较了随机森林、支持向量机、多层感知机、梯度提升决策树和逻辑回归等6种常见分类算法。实验结果表明,随机森林算法表现最优,模型预测精度达到91%。  相似文献   

19.
推荐系统中的辅助信息可以为推荐提供有用的帮助,而传统的协同过滤算法在计算用户相似度时对辅助信息的利用率低,数据稀疏性大,导致推荐的精度偏低.针对这一问题,本文提出了一种融合用户偏好和多交互网络的协同过滤算法(NIAP-CF).该算法首先根据评分矩阵和项目属性特征矩阵挖掘出用户的项目属性偏好信息,然后使用SBM方法计算用户间的项目属性偏好相似度,并用其改进用户相似度计算公式.在进行评分预测时,构建融合用户-项目属性偏好信息的多交互神经网络预测模型,使用动态权衡参数综合由用户相似度计算出的预测评分和模型的预测评分来进行项目推荐.本文使用MovieLens数据集进行实验验证,实验结果表明改进算法能够提高推荐的精度,降低评分预测的MAE和RMSE值.  相似文献   

20.
This paper examines aspects affecting user behaviours in Web browsing with a discussion of existing models for both the computer and human aspects of Web browsing. Problems in Web information retrieval are analysed and studies related to the reuse of user experience in Web browsing are reviewed. An object-oriented model for user behaviours in Web browsing is proposed in which both the information from the Web and the information retained by users are modelled as objects. Thus, user actions on the Web are described as a graph of objects or transformations from one object to another. A framework for reuse of user experience is provided. The possible methods of reusing Web browsing experience are described for the scenario of reusing by oneself (history mechanism, prediction) or reusing by others (collaborative filtering, instructions).  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号