首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
石立兴  胡访宇 《计算机应用》2015,35(9):2453-2456
针对当前基于呼叫详细记录(CDR) 研究用户移动性主要局限于移动距离、回旋半径等一维尺度,且该尺度不能准确描述移动范围的问题,提出在二维空间上用覆盖移动轨迹的凸包面积来描述用户的移动范围,用群体移动向量分析人群的移动行为。首先,设计了一种基于经纬度建立二维平面笛卡尔坐标系的方法。该方法结合墨卡托投影与半正矢公式得到散点间方位与距离,并依此确立散点在平面坐标系的坐标;然后,基于该坐标系计算了覆盖用户一天内移动轨迹的凸包及其面积,并统计其分布;最后,对所有用户的移动向量分时段作累积,分析群体移动向量在一天内的变化。实验结果表明,在180 km范围内,新坐标所计算的方位角与由墨卡托投影下确定的结果平均偏差0.037°,点间距离与由半正矢公式得到的结果平均偏差0.102%,可以很好地保持散点间的方位与距离关系。覆盖移动轨迹的凸包面积满足幂律分布,并与移动距离有较高的相关性。群体移动向量的变化展现了人群移动的潮汐现象,而且为发掘用户所在区域与周边地区的联系提供新的视角。  相似文献   

2.
带有关联关系的数据在社网平台、电子商务平台、科学数据库等环境中普遍存在,对其进行相似性查询是在各种应用中常见的操作。随着社网、电子商务、云计算等技术的发展和普及,具有关联关系的数据飞速增长,对这种类型的数据进行相似性查询成为数据库领域的一个研究热点。在此应用背景下,提出了一种基于决策树的面向关联关系型数据的分布式相似性查询方法。该方法依据属性的重要度计算相似性,计算过程中达到一定的准确度时可以结束计算,从而在保证准确性的情况下减少了计算量。同时提出了两种分布式环境下面向大数据量的决策树计算方法,该方法具有较少的通信代价,并且有概率理论保证其准确度。最后通过大量的实验证明了方法的有效性。  相似文献   

3.
不同城市功能区区域之间具有外在物理差异和内在功能差异,且随时间和人类活动不断发生演变。针对卫星遥感等传统监测方法存在运行周期长、成本高,不能表征内在功能差异等问题,利用通信运营商提供的用户生活数据——呼叫详细记录(CDR),进行城市功能区识别研究。首先,以人工标注的方法对基站小区进行功能区分类,得到住宅区、办公区、商业区、高校区、景点区五类训练样本;然后,提取各功能区内用户群体的通话行为和移动行为特征,进行差异性对比分析;最后,利用高斯混合模型(GMM)设计出多特征加权判决的功能区识别算法,并用训练集对该算法进行仿真。实验结果表明,CDR数据可以对城市功能区之间的内在差异进行表征,功能区性质与用户的通话行为和移动行为存在对应关系;判决权重为0.6时,该算法在现有数据集下的功能区召回率达到了最大,为51.08%。结合误差分析表明CDR数据在城市功能区识别应用上具有可行性。  相似文献   

4.
了解城市内居民的社会属性,如职业属性,对公共政策的制定具有重要意义。很多研究通过分析社交网络行为来获取人员社会属性信息,却忽视了社会属性信息与个人日常活动之间的关系;还有部分研究使用时空数据进行分析,但受到样本特征的限制。呼叫详细记录(CDR)间接记录了粗糙的人员日常活动轨迹,基于CDR提出城市居民职业属性提取模型,先提取居民停留点和轨迹链,再计算职住位置,并结合兴趣点(POI)信息构建个人出行特征和区域特征,最后使用半监督分类模型提取城市居民职业属性。对覆盖600万人的CDR数据来分析和提取两种职业类型的人:学生和城市蜂鸟,最终模型的F1得分超过0.95。  相似文献   

5.
文章针对目前分布式缓存系统命中率低和查询处理时间长的问题,在分析某中文搜索引擎于2009年9月查询日志集的用户查询特征和热点内容分布特征的基础上,设计并实现了包括静态缓存和动态缓存的双级缓存结构。最后,从理论分析和实验数据两方面,论证了基于查询日志的双级缓存结构在性能方面更具优越性。  相似文献   

6.
基于数据网格的分布式查询优化模型   总被引:2,自引:0,他引:2  
罗永红  陈特放  张友生 《计算机应用》2008,28(10):2553-2557
智能交通系统(ITS)中多个异构的、地理位置分散的数据源能使用像数据网格这样的分布式计算技术进行集成,这种集成所面临的真正挑战是分布式查询处理引擎的设计和开发。一般而言,分布式查询优化按照以下三个阶段进行:查询所涉及节点的确定,并行执行方案的生成,执行查询的最佳节点选择。由于这三个阶段的相互隔离可能会导致得到的查询方案并不是最佳的,提出了一个新的分布式查询优化模型,该模型集成了查询优化的三个阶段,综合考虑了查询优化各个阶段所涉及的参数,如节点的有效内存、处理速度、数据传输容错能力等。  相似文献   

7.
DQP:网格上的一种分布式查询处理器   总被引:2,自引:0,他引:2  
网格计算是近年来兴起的一个研究热点,它旨在使互联网上所有资源(计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等)实现全面共享与协同工作,使整个因特网整合成一台巨大的超级计算机,为用户提供“即连即用”式的服务。文中介绍了网格计算的概念、特点,以及开放网格服务体系结构(OGSA),详细介绍了OGSA—DQP的功能、架构、实现方法以及执行流程。  相似文献   

8.
网格计算是近年来兴起的一个研究热点,它旨在使互联网上所有资源(计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等)实现全面共享与协同工作,使整个因特网整合成一台巨大的超级计算机,为用户提供“即连即用”式的服务。文中介绍了网格计算的概念、特点,以及开放网格服务体系结构(OGSA),详细介绍了OGSA-DQP的功能、架构、实现方法以及执行流程。  相似文献   

9.
Mobile Agent技术是一种新型Agent技术,具有移动性、智能性和异步计算等特点。文中针对Mobile Agent技术进行了系统的概述和探讨,提出了把Mobile Agent技术应用于分布式查询系统中的思想,并给出了基于Mobile Agent技术的分布式查询系统模型和体系结构,最后描述了Agent间的通讯方法。  相似文献   

10.
大数据环境下数据库所存储的数据量呈爆炸式增长,如何保持高吞吐率并让客户得到满意的数据查询和处理结果,已经成为一个急需解决的问题。金融、电信以及互联网等行业要求企业的统计分析平台能支持分布式、高可用性和可扩展性的分布式查询环境,以便能及时高效的完成查询分析任务,做出更合理的业务决策。目前已经有很多公司在一定范围内将应用从关系数据库向Hbase进行迁移,但是大多数都是和Hadoop MapReduce或Hive结合使用,导致数据量增加后的分布式查询耗时过长,性能也随之下降。此外Hbase也有其自身的局限性,不能兼容传统数据库上的SQL应用。本文在分析了现有分布式数据库系统平台并深入研究Hbase的实现原理及高级特性的基础上,提出了基于Hbase的可扩展性查询优化方案(Hbase DSPE),即把Hbase的优点和SQL的易用性结合。这样做有助于对复杂SQL查询的优化,可以充分利用Hbase的诸多高级特性进行查询性能调优,对企业在大数据环境下从传统关系数据库向大数据平台的迁移具有现实的指导意义。  相似文献   

11.
信息检索的效果很大程度上取决于用户能否输入恰当的查询来描述自身信息需求。很多查询通常简短而模糊,甚至包含噪音。查询推荐技术可以帮助用户提炼查询、准确描述信息需求。为了获得高质量的查询推荐,在大规模“查询-链接”二部图上采用随机漫步方法产生候选集合。利用摘要点击信息对候选列表进行重排序,使得体现用户意图的查询排在比较高的位置。最终采用基于学习的算法对推荐查询中可能存在的噪声进行过滤。基于真实用户行为数据的实验表明该方法取得了较好的效果。  相似文献   

12.
基于用户兴趣的查询扩展语义模型   总被引:1,自引:0,他引:1  
自然语言中词的同义现象和歧义现象一直是降低信息检索查全率和查准率的关键,在Web搜索引擎上显得更加突出。提出了一种基于用户兴趣的查询扩展语义模型,通过构建基于Yahoo的语义ontology知识库消除同义现象,设计客户端的用户兴趣挖掘模型消除歧义现象。实验结果显示该方法能有效提高Web信息检索的查全率与查准率。  相似文献   

13.
陈戈  施丽  李也白 《计算机与现代化》2011,(12):106-108,111
在分析比较分布式数据库系统和集中式数据库系统结构以及查询优化目标不同特点的基础上,归纳出分布式数据库系统的查询处理和优化,介绍分布式查询优化技术中非常有效的半连接操作技术,并在此基础上重点讨论基于半连接的分布式查询优化方法——PERF连接技术。  相似文献   

14.
为了更好地解决分布式查询优化问题,论文在传统GEP算法的基础上,结合禁忌搜索策略,提出了基于禁忌GEP的分布式数据库查询优化算法(DistributeddatabasequeryoptimizationalgorithmbaseduponTabu-GEP,DDQO-TGEP)。仿真实验表明,随着查询关系个数的增加,DDQO-TGEP算法执行查询时所需要的查询优化时间和最优查询策略生成时间都比传统的GA和GP算法显著下降,其中查询优化时间最大下降约42.16%,最优查询策略生成时间最大下降约36.8%。  相似文献   

15.
随着信息和网络技术的发展,分布式数据库得到了广泛的发展,其中Oracle分布式数据库在企业管理中得到了极大的应用。为了能够更好地提高企业的竞争力,对Oracle分布式数据库的查询进行优化成为必要。从介绍Oracle分布式数据库的两种基本结构出发,重点介绍了几种不同的Oracle分布式数据库的查询优化方法及其SQL语句的实现,并且通过试验对优化方法的性能进行了测试,然后通过数据的对比体现出了查询优化前后的差别,最后给出了可能影响查询优化性能的因素。  相似文献   

16.
用户通话产生的详细话单数据具有丰富的时空信息和社交信息,这些信息在一定程度上反映了用户的生活习惯和社交模式,对于移动通信用户画像研究具有重要意义.我们的研究是基于中国某运营商提供的10 000名用户一个月详细话单数据,本文从用户日常移动模式方面提取移动距离、回旋半径、访问点个数和移动方向熵特征,从用户社交生活方面提取通话时长、联系人数量、主叫比率和社交熵特征,利用上述特征对用户进行群体划分和构建用户词云名片,从而完成对移动通信用户的画像研究.本文使用用户话单数据为推测用户属性、理解用户特征提供了新的视角.  相似文献   

17.
唐爽  王亚沙  赵俊峰  王江涛  夏丁 《软件学报》2019,30(5):1532-1546
基于数据分析的智能决策对提升企业竞争力具有重要意义.根据待分析的问题,从内部信息系统的数据库中查询并获取与问题密切相关且信息完整的数据,是企业数据分析过程中的关键环节.基于本体的可视化数据查询系统为不掌握计算机专业技能的终端用户提供了高效获取数据的手段,近年来成为研究热点.然而现有工作仅采用简单的映射规则,将数据库中的表、字段、外键关系等元素直接映射为本体中的概念、属性和关系,向终端用户暴露了过多数据库设计的技术细节,增加了用户理解的难度,降低了系统的可用性.而通过人工编写映射规则来屏蔽数据库细节,既低效又缺乏通用性.针对这一问题,提出了一种基于推理的终端用户本体查询构造方法.该方法利用本体模型的语义表达能力和推理能力,在原有基于数据库简单映射所生成的本体模型基础上注入领域知识,从而优化查询构造流程,使终端用户得以从其更为熟悉的业务知识的视角,而非数据库设计的视角来看待和操纵数据,提高系统可用性;同时,增加了对分组统计的支持,扩展了方法的适用范围.最后,通过对"餐饮前台信息管理"领域真实案例的分析,验证了该方法相对于已有方法,其可用性提高了53.44%,表达能力提高了20.43%.  相似文献   

18.
基于Oracle分布式数据库的查询优化   总被引:2,自引:0,他引:2  
随着信息和网络技术的发展,分布式数据库得到了广泛的发展,其中Oracle分布式数据库在企业管理中得到了极大的应用.为了能够更好地提高企业的竞争力,对Oracle分布式数据库的查询进行优化成为必要.从介绍Oracle分布式数据库的两种基本结构出发,重点介绍了几种不同的Oracle分布式数据库的查询优化方法及其SQL语句的实现,并且通过试验对优化方法的性能进行了测试,然后通过数据的对比体现出了查询优化前后的差别,最后给出了可能影响查询优化性能的因素.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号