首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
一种有效的基于生活熵的移动用户分类算法   总被引:2,自引:0,他引:2  
从海量移动用户通话记录中,根据用户的行为模式对用户进行分类挖掘.主要贡献包括:1)提出了生活熵的概念,用以刻画移动用户行为的规律性;2)提出基于生活熵的个人用户行为的分类算法;3)在大量真实移动数据集上进行了实验分析.利用本文提出的方法,可以有效的根据用户的行为特征对移动用户进行分类,在移动客户分析方面有较大的应用前景.  相似文献   

2.
《微型机与应用》2015,(12):11-13
移动互联网时代,各类移动网络终端的使用在为移动用户带来便利的同时,也为运营商提供了海量的可供挖掘数据来源。运用大数据技术对非结构、半结构、结构化数据进行数据挖掘,可以有效提高挖掘效率,帮助运营商找到潜在商机、提升用户体验、进行精确营销。针对大数据挖掘中存在的效率问题,提出了基于改进SALS算法的Hadoop推测调度,从而减少异构环境下的资源浪费,提高大数据挖掘效率。  相似文献   

3.
OSAF-tree--可迭代的移动序列模式挖掘及增量更新方法   总被引:1,自引:0,他引:1  
移动通信技术和无限定位技术的发展积累了海量的、动态增长的时空数据.利用数据挖掘技术从移动用户的时空行为轨迹当中挖掘用户移动序列模式,在移动通信、交通管理、基于位置服务等领域有着广泛的应用前景.由于移动环境网络资源珍贵、数据量大的特点,传统的序列模式挖掘方法在效率上很难满足需求.OSAF-tree算法基于投影的概念,只需要对数据库进行一遍扫描,就可以很好地处理移动序列模式的挖掘及其增量更新和迭代挖掘问题,这是一个非常高效的算法.与已有的方法相比,OSAF-tree算法在性能和I/O代价等方面都具有明显的优势.  相似文献   

4.
传统的移动用户位置预测方法由于模式支持度计算方式不合理,存在预测精度偏低的问题。为此,提出了一种基于模式匹配度的用户移动规则挖掘及位置预测方法,并将其用于移动通信系统中,以基台覆盖范围网格为单元的用户位置预测。具体包括三个步骤:通过图的遍历挖掘用户移动模式、基于用户移动模式生成用户移动规则和依据用户移动规则进行位置预测。实验分析使用10个批次轨迹数据进行用户移动规则挖掘,结果表明,该方法挖掘出的用户移动规则数少、支持度高和置信度高,具有高精度的优点。  相似文献   

5.
随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理数据的方式用Map Reduce函数实现并行化处理,同时结合区间数的概念,将移动用户数据用一个区间表示,计算其区间距离来适应移动用户数据的不确定性特点,从而提高聚类效率与准确率。最后利用MIT Reality项目数据集进行仿真,仿真结果表明了该方法的有效性及可行性,为移动用户数据的进一步利用及用户的个性化推荐提供支持。  相似文献   

6.
随着移动通信技术的发展,传统智能终端设备无法满足快速增长的海量数据计算要求,移动边缘计算为物联网中移动用户提供了低延迟和灵活的计算方案。综合考虑边缘服务器上有限的计算资源以及网络中用户的动态需求,提出通过二进制粒子群优化算法分配发射功率优化传输能耗。将请求卸载与资源调度作为双重决策问题进行分析,基于粒子群优化算法提出了一种新的多目标优化算法求解该问题。仿真结果表明,二进制粒子群优化算法可以节省传输能耗,且具有良好的收敛性。所提出的新算法在响应率方面优于现有算法,在动态边缘计算网络中可以保持良好的性能。  相似文献   

7.
针对移动用户行为序列的情景感知特性,提出一种基于情景感知的行为转移模式推荐算法MPRC。该算法首先采用Apriori对用户历史行为数据进行长度为2的频繁模式的挖掘过滤,然后将过滤后的行为数据转换成决策表,采用粗糙集规则提取对决策表进行处理,挖掘情景转移模式,最后通过模式匹配及情景相似性计算进行推荐排序。实验结果证明了该算法在移动环境下的模式挖掘及推荐方面的有效性和较高的准确性。  相似文献   

8.
针对异构无线网络环境中现有垂直切换算法存在难以实现移动用户接入网络的无缝切换,无法向用户提供稳定通信服务的问题,提出一种基于移动用户位置预测的垂直切换算法。首先利用用户移动轨迹的相似性,使用用户轨迹数据离线训练LSTM模型以学习各用户普遍具有的移动规律;然后在线加载LSTM模型进行用户位置预测,从而使用模糊逻辑分析计算下一时刻用户对应候选网络的回报值,并选取回报值最高的网络进行切换。实验结果表明,该算法与已有垂直切换算法相比,在不同的用户移动速度和用户规模条件下的切换次数、切换失败次数和切换时延均有明显下降,内存消耗较低,能够实现无缝切换。  相似文献   

9.
针对移动服务推荐中用户上下文环境复杂多变和数据稀疏性问题,提出一种基于移动用户上下文相似度的张量分解推荐算法——UCS-TF。该算法组合用户间的多维上下文相似度和上下文相似可信度,建立用户上下文相似度模型,再对目标用户的K个邻居用户建立移动用户-上下文-移动服务三维张量分解模型,获得目标用户的移动服务预测值,生成移动推荐。实验结果显示,与余弦相似性方法、Pearson相关系数方法和Cosine1改进相似度模型相比,所提UCS-TF算法表现最优时的平均绝对误差(MAE)分别减少了11.1%、10.1%和3.2%;其P@N指标大幅提升,均优于上述方法。另外,对比Cosine1算法、CARS2算法和TF算法,UCS-TF算法在数据稀疏密度为5%、20%、50%、80%上的预测误差最小。实验结果表明UCS-TF算法具有更好的推荐效果,同时将用户上下文相似度与张量分解模型结合,能有效缓解评分稀疏性的影响。  相似文献   

10.
在移动计算中与移动用户位置相关的移动对象位置管理服务以及基于位置的移动增值服务等都离不开移动用户移动模式的挖掘。该文利用用户的移动日志,通过非二频繁项集把整个日志切割为一系列的子序列,然后把子序列分别归入频繁子序列和非频繁子序列这两个箱中,再分别对其进行合并和拆分处理,寻找最大频繁项集,即移动用户的最大移动模式。  相似文献   

11.
The goal of analyzing a time series database is to find whether and how frequent a periodic pattern is repeated within the series. Periodic pattern mining is the problem that regards temporal regularity. However, most of the existing algorithms have a major limitation in mining interesting patterns of users interest, that is, they can mine patterns of specific length with all the events sequentially one after another in exact positions within this pattern. Though there are certain scenarios where a pattern can be flexible, that is, it may be interesting and can be mined by neglecting any number of unimportant events in between important events with variable length of the pattern. Moreover, existing algorithms can detect only specific type of periodicity in various time series databases and require the interaction from user to determine periodicity. In this paper, we have proposed an algorithm for the periodic pattern mining in time series databases which does not rely on the user for the period value or period type of the pattern and can detect all types of periodic patterns at the same time, indeed these flexibilities are missing in existing algorithms. The proposed algorithm facilitates the user to generate different kinds of patterns by skipping intermediate events in a time series database and find out the periodicity of the patterns within the database. It is an improvement over the generating pattern using suffix tree, because suffix tree based algorithms have weakness in this particular area of pattern generation. Comparing with the existing algorithms, the proposed algorithm improves generating different kinds of interesting patterns and detects whether the generated pattern is periodic or not. We have tested the performance of our algorithm on both synthetic and real life data from different domains and found a large number of interesting event sequences which were missing in existing algorithms and the proposed algorithm was efficient enough in generating and detecting periodicity of flexible patterns on both types of data.  相似文献   

12.
在数据挖掘以及机器学习等领域,都需要涉及一个数据预处理过程,以消除数据中所包含的错误、噪声、不一致数据或缺失值。其中,缺失值的填充是一个非常具有挑战性的任务,因为填充效果的好坏会极大的影响学习算法及挖掘算法的后续处理过程。目前已有的一些填充算法,如基于粗糙集的和基于最近邻法的算法等,在一定程度上能够处理缺失值问题。与以上方法不同,提出了一种扩展的基于信息增益的缺失值填充算法,它充分利用数据集中各属性之间隐含的关系对缺失的数据进行填充。大量的实验表明,提出的扩展的基于信息增益的缺失值填充算法是有效的。  相似文献   

13.
大数据下不完备信息系统近似空间的并行算法   总被引:1,自引:0,他引:1  
上、下近似空间是粗糙理论的重要概念,解决上、下近似问题是海量数据挖掘的基础。经典的近似空间算法不适合处理海量数据,更不适合处理带缺失信息的海量数据问题。为此,通过深度分析带缺失信息的海量数据特征,结合MapReduce编程模型,提出了基于MapReduce框架下近似空间的并行算法,以处理带缺失信息的海量数据,实验结果表明了该并行算法的有效性。  相似文献   

14.
In this paper, we present a new data mining algorithm which involves incremental mining for user moving patterns in a mobile computing environment and exploit the mining results to develop data allocation schemes so as to improve the overall performance of a mobile system. First, we propose an algorithm to capture the frequent user moving patterns from a set of log data in a mobile environment. The algorithm proposed is enhanced with the incremental mining capability and is able to discover new moving patterns efficiently without compromising the quality of results obtained. Then, in light of mining results of user moving patterns and the properties of data objects, we develop data allocation schemes that can utilize the knowledge of user moving patterns for proper allocation of both personal and shared data. By employing the data allocation schemes, the occurrences of costly remote accesses can be minimized and the performance of a mobile computing system is thus improved. For personal data allocation, two schemes are devised: one utilizes the set level of moving patterns and the other utilizes their path level. Schemes for shared data are also developed. Performance of these schemes is comparatively analyzed.  相似文献   

15.
谭征  刘惊雷  余航 《计算机应用》2017,37(11):3107-3114
针对在数据库的个性化查询中条件约束(或上下文约束)没有被充分考虑的问题,首先提出了条件约束模型i+≻i-|X,它表示在上下文X的约束下,相对于i-,用户更偏好i+。在此模型的基础上,采用最大团(MaxClique)关联规则算法挖掘获得用户偏好;随后又提出了条件偏好挖掘(CPM)算法,该算法结合上下文用于挖掘偏好规则,从而得出用户的偏好。实验结果表明,基于CPM算法的偏好挖掘模型具有较强的偏好表达能力,将CPM算法与基于Apriori的算法以及CONTENUM算法进行了实验对比,实验的主要参数为最小支持度、最小可信度、数据规模等,实验结果进一步表明所提出的CPM算法可明显提高用户偏好规则的产生效率。  相似文献   

16.
Traditional researches on user preferences mining mainly explore the user's overall preferences on the pro ject, but ignore that the fundamental motivation of user preferences comes from their attitudes on some attributes of the pro ject. In addition, traditional researches seldom consider the typical preferences combination of group users, which may have influence on the personalized service for group users. To solve this problem, a method with noise reduction for group user preferences mining is proposed, which focuses on mining the multi-attribute preference tendency of group users. Firstly, both the availability of data and the noise interference on preferences mining are considered in the algorithm design. In the process of generating group user preferences, a new path is used to generate preference keywords so as to reduce the noise interference. Secondly, the Gibbs sampling algorithm is used to estimate the parameters of the model. Finally, using the user comment data of several online shopping websites as experimental objects, the method is used to mine the multi-attribute preferences of different groups. The proposed method is compared with other methods from three aspects of predictive ability, preference mining ability and preference topic similarity. Experimental results show that the method is significantly better than other existing methods.  相似文献   

17.
建立了一种基于高维聚类的探索性文本挖掘算法,利用文本挖掘的引导作用实现数据类文本中的数据挖掘。算法只需要少量迭代,就能够从非常大的文本集中产生良好的集群;映射到其他数据与将文本记录到用户组,能进一步提高算法的结果。通过对相关数据的测试以及实验结果的分析,证实了该方法的可行性与有效性。  相似文献   

18.
自适应网站能够提高网站对用户的服务质量。本文首先给出自适应网站的总体框架,对框架中主要模块做详细的分析,包括数据预处理、数据挖掘、页面推荐和站点调整。在数据挖掘模块给出一种有效的识别用户访问模式的算法,该算法利用数据库查询简化频繁最大前向访问路径集的查找,并在此基础上形成频繁访问路径图,为页面推荐和站点调整做好准备。最后给出自适应网站的设计原则。  相似文献   

19.
王俊陆  王玲  王妍  宋宝燕 《计算机科学》2017,44(2):98-102, 106
随着互联网及信息技术的发展,数据缺失、损坏等问题越来越普遍,尤其随着数据收集工作从人工转向机器,存储介质的不稳定性及网络传输出现遗漏等原因都导致数据缺失更加严重。数据库中大量的缺失值不仅严重影响了用户查询质量,还对数据挖掘与数据分析结果的正确性造成了影响,进而误导决策。目前,对缺失数据的填补还没有一种比较通用的方法,大部分策略都是针对某一类型的缺失值问题进行处理。因此,针对不同缺失类型同时出现在不完备数据中的复杂情况,提出了一种基于元组相似度的不完备数据填补方法(IATS)。采用数据挖掘的方法提取出不完备数据集中的加权关联规则,并根据此规则进行常规缺失数据的填补,而对于数据集的异常缺失问题,又引入数据推荐算法,采用推荐筛选策略进行元组相似度的计算并实现相应填补,在很大程度上提高了数据的有效利用率和用户查询结果的质量。实验表明,IATS策略在保证填补率的前提下具有更好的准确率。  相似文献   

20.
为了挖掘可疑通信的行为模式,定位发生了可疑通信行为的上网账户,本文首先分析了可疑通信行为特点。然后针对已有关联规则挖掘算法不能同时满足多层次数据挖掘和加权关联规则挖掘的问题,分析对比两种典型的基本关联规则算法,以FP-tree为基础,提出了ML-WFP多层次加权关联规则挖掘算法。针对算法中数据项权重的确定问题,由用户设置数据项间的重要性比较关系,借鉴模糊一致矩阵的概念,利用模糊层次分析法计算数据项的权重。最后将该算法应用于可疑通信行为的挖掘。实验测试结果表明可疑通信行为挖掘方案合理有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号