排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
基于人工免疫算法的增量式用户兴趣挖掘 总被引:1,自引:0,他引:1
了解用户兴趣是为用户提供个性化服务的关键.用户兴趣有短期兴趣和长期兴趣之分,且具有不稳定性.受人工免疫系统的启发,巧妙地将免疫应答过程应用于用户兴趣挖掘.首先将概率与时间相结合,提出“概念时序动态”的概念,以更好地刻画用户在一段时间内对同一兴趣的关注程度;然后基于人工免疫原理,建立抽取兴趣标签的分类器来提取用户兴趣标签;最后针对增量式学习,建立兴趣标签的“概念时序动态”,刻画出用户兴趣自首次出现以来受关注的程度,以此为依据来判断兴趣是否存在迁移及遗忘现象,并为每个兴趣标签附上权重.其主要贡献是创造性地将人工免疫原理应用于用户短期兴趣和长期兴趣的挖掘,并具有增量特性,可以很好地体现用户兴趣迁移特征,是一种自然完整的用户兴趣模型.实验结果表明,该学习模型能够很好地发现用户关注的领域,其平均精度和召回率分别达到79.5%和74.4%,是目前最贴近用户的兴趣挖掘模型. 相似文献
2.
聚类是数据挖掘领域中的一种重要的数据分析方法.它根据数据间的相似度,将无标注数据划分为若干聚簇.CSDP是一种基于密度的聚类算法,当数据量较大或数据维数较高时,聚类的效率相对较低.为了提高聚类算法的效率,提出了一种基于密度的分布式聚类方法MRCSDP,利用MapReduce框架对实验数据进行聚类.该方法定义了独立计算单元和独立计算块的概念.首先,将数据拆分为若干数据块,构建独立计算单元和独立计算块,在集群中分配独立计算块的任务;然后进行分布式计算,得到数据块的局部密度,将局部密度合并得到全局密度,根据全局密度计算中心值,由全局密度和中心值得到每个数据块中候选聚簇中心;最后,从候选聚簇中心选举出最终的聚簇中心.MRCSDP在充分降低时间复杂度的基础上得到较好的聚类效果.实验结果表明,分布式环境下的聚类方法MRCSDP相对于CSDP更能快速、有效地处理大规模数据,并使各节点负载均衡. 相似文献
3.
21世纪的当今,是一个时代大发展、大进步的黄金时期,物质上的极大丰富,在满足人们基本需求的同时,也衍生出了一个巨大问题:腐败问题。中国在当今提出了“中国梦”的设想,并努力付诸实践,发现“反腐败”成为实现“中国梦”的前提。如何在财政部门、中小企业当中杜绝腐败现象发生,会计从业人员应如何合理规范自己才能做好财政部门的看管人,成为一个值得探讨的问题。 相似文献
4.
1