首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
面对城市出租车高空载率和乘客打车难问题,本文针对出租车司机端和乘客端分别进行载客热点和打车热点的分析研究,提出了一种基于DBSCAN算法的数据处理模型.利用这个模型对北京市182辆出租车的GPS轨迹数据进行处理,提高了数据精度;对于不同的受众,采用K-means算法对数据进行聚类分析,得到相关热点.实验表明,划分目标用户进行各热点的推荐不仅可以有效地为出租车司机提供高概率的载客热点,乘客打车难问题也有了一种可行的解决方法.  相似文献   

2.
目前常见的轨迹聚类大多基于OPTICS、DBSCAN和K-means等算法,但这些聚类方法的时间复杂度随着轨迹数量的增加会大幅上升。针对该问题,提出一种基于密度核心的轨迹聚类算法。通过引入密度核心的概念,设计轨迹密度计算函数以获取聚类簇的致密核心轨迹,同时利用出租车载客轨迹自身的方向和速度等属性提取轨迹特征点,减少轨迹数据量。在此基础上,根据聚类簇中致密核心轨迹与参与聚类轨迹的相似度距离判断轨迹的匹配程度,进而聚合相似轨迹,并将聚类结果储存在聚类节点中。实验结果表明,与TRACLUS和OPTICS聚类算法相比,该算法能够得到更准确的聚类效果,并且时间效率更高。  相似文献   

3.
出租车轨迹是蕴含着居民出行行为的地理时空大数据,从出租车轨迹数据中挖掘居民出行的热点区域和移动模式对于城市规划、交通管理等具有重要意义。针对现有热点区域挖掘方法在面对大规模轨迹数据时存在的伸缩性差、计算效率低等问题,提出一种基于网格密度的GScan聚类算法。该算法首先将轨迹空间划分成网格单元,并设定网格单元的密度阈值;然后将轨迹点映射到网格单元,基于密度阈值提取热点网格单元;通过合并可达热点网格单元发现城市的热点区域。以重庆市出租车轨迹载客/卸客点进行实例分析,给出网格单元大小和密度阈值2个参数的设定方法,得到重庆市主城区居民出租车出行热点区域的时空分布,进而分析重庆市居民出行行为。  相似文献   

4.
出租车GPS装备的普及使用产生了大量轨迹数据。出租车异常轨迹的检测和分析,可为惩罚具有欺诈行为的出租车司机提供有益支撑。针对出租车稀疏轨迹,基于轨迹相对相似度检测异常轨迹,由于其具有不对称性,类似于DBSCAN的传统密度聚类方法无法适应此种情况,本文提出基于密度RDBSCAN算法用于出租车异常轨迹聚类检测。对于聚类得出的候选异常轨迹,结合轨迹密度异常值和轨迹长度异常值的概念,利用证据理论综合前述2个因素来判别轨迹的异常程度,进而得到异常程度最高的TOP-N异常轨迹。使用旧金山真实的出租车数据,通过提取相同起点和终点(Origin-Destination, OD)的轨迹集进行实验,实验结果表明本文提出的方法能够有效地检测到异常轨迹,并成功给出异常程度最高的TOP-N异常轨迹。  相似文献   

5.
基于聚类的出租车异常轨迹检测   总被引:1,自引:0,他引:1  
《计算机工程》2017,(2):16-20
出租车全球定位系统数据中蕴含城市交通和移动对象行为的宏观信息,从中可以挖掘出有价值的异常轨迹模式。将位置和几何形状、行驶时间分别作为出租车轨迹的空间与时间特征,根据特征偏离情况划分时间、空间和时空异常轨迹。从轨迹数据中提取相同起终点的轨迹集,将轨迹划分成轨迹片段,计算轨迹间的相似度并进行基于距离和密度的聚类,在空间特征上初步分离出频繁和稀疏轨迹,根据数据异常判定的kσ准则确定时间特征异常的分离阈值,对时间特征进行再次划分,最终实现出租车异常轨迹检测。实验结果表明,该方法能从异常轨迹中挖掘出个性化路线、异常停留位置和交通路段,为智能交通、物流高效规划和执行等提供参考信息。  相似文献   

6.
7.
现有解决打车难问题的研究工作大部分是集中式地调度出租车,且大多方法在单一服务器上运行串行算法分析海量出租车GPS数据,计算量大,会遇到计算时间和计算资源的瓶颈。为此提出一种基于MapReduce的出租车停泊点智能推荐算法,为司机或乘客推荐更容易接到乘客或打到车的地点。算法通过挖掘大量出租车GPS轨迹数据,检测出停泊点,并生成停泊点知识库。再利用推荐模型为司机或乘客推荐最佳停泊点。实验分析了北京市真实出租车GPS轨迹数据,结果表明该算法能有效为司机和乘客推荐出停泊点,且在大数据量下具有较高的效率。  相似文献   

8.
城市大数据为探索城市内部居民出行的行为特征提供数据支撑.本文将以兰州市出租车GPS轨迹数据为基础,结合数据挖掘和可视化技术,研究兰州市城市居民出行规律和城市空间交互特征.首先,分析4个城区居民出行特征和城区间空间交互特征;然后,采用城市栅格方法,统计分析城市栅格空间之间的交通出行量,并采用CLARA聚类算法识别工作日和...  相似文献   

9.
一种基于网格密度的自适应聚类分析算法   总被引:1,自引:0,他引:1  
在结合基于密度和基于网格的聚类算法优点的基础上,提出一种新的聚类算法.该算法能够在海量、高纬数据下发现任意形状的聚类并对噪声数据不敏感,具有较低的时间和空间复杂性及较高的识别率.通过实验对该算法进行了性能比较和测试,显示了它在各方面的优越性.  相似文献   

10.
基于k均值分区的流数据高效密度聚类算法   总被引:2,自引:0,他引:2  
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的.  相似文献   

11.
针对目前出租车交接班行为识别不够精准的问题,提出了一种基于轨迹数据挖掘的出租车交接班行为精准识别的方法。首先,分析出租车停留状态的数据特性后,提出了一种出租车非运营状态停留点检测方法;然后,对停留点进行聚类,从而得出了潜在的出租车交接班地点;最后,基于出租车交接班事件的判断指标与出租车交接班时间的核密度估计,有效地识别出出租车交接班地点和时间。以福州市4 416辆出租车的轨迹数据为实验样本,共识别出了5 639个交接班地点,这些交接班地点在市民主要工作区域、交通枢纽、商圈以及风景名胜。而识别出的交接班时间主要在凌晨4:00—6:00与傍晚16:00—18:00,与福州市民众出行规律相吻合。实验结果表明,该方法能有效地检测出出租车交接班的时空分布,能为城市的交通资源规划与管理提供合理建议,且使公众打车出行更加便捷,提高了出租车的运行效率,为城市加油站、充电站等汽车相关设施的选址优化提供了参考。  相似文献   

12.
针对密度聚类DBSCAN算法存在的聚类效果对输入参数敏感的问题,提出了一种基于k-means改进算法确定DBSCAN算法参数的方案来提高聚类质量。将改进k-means算法与DBSCAN算法相结合应用于入侵检测系统,实验结果表明,新方法较好地解决了传统DBSCAN聚类算法中参数选择的敏感问题,相比于李娜等人提出的算法,结合算法使检测率提高了3.32%,误报率降低了1.83%。  相似文献   

13.
出租车换道行为的统计特性对研究经济、心理等人类动力学有重要的意义.结合大数据分析技术,基于西安市出租车GPS轨迹数据对出租车司机的换道行为进行了定量研究.设计了一种基于出租车GPS轨迹数据的出租车司机换道行为识别模型,利用大数据平台对出租车司机换道次数按不同时段进行了定量统计,对出租车司机换道次数、出租车平均行驶速度和出租车司机的收入之间进行了相关性分析.分析结果表明,出租车频繁换道行为对司机收益呈现负相关影响,进一步说明出租车司机驾驶习惯和和心理对整个出租车运营有显著影响.  相似文献   

14.
一种有效的基于网格和密度的聚类分析算法   总被引:12,自引:0,他引:12  
胡泱  陈刚 《计算机应用》2003,23(12):64-67
讨论数据挖掘中聚类的相关概念、技术和算法。提出一种基于网格和密度的算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好地处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。  相似文献   

15.
针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后通过密度聚类将数据集划分为高密度区域和低密度区域;接着构建和分割最小生成树对低密度区域内样本进行关联挖掘,用于将高密度区域与低密度区域互联;最后计算簇密度并以此作为特征进行簇合并,得到聚类结果.该算法结合图论知识,将数据按密度特征进行分块后合并处理,克服了传统密度聚类算法存在的局限性.通过选取多个不平衡人工数据集和UCI数据集对该算法进行测试,验证了该算法的有效性与鲁棒性.  相似文献   

16.
《计算机工程》2017,(5):16-22
根据出租车行驶载客数据中提取的乘客出行模式和上下客热门区域,提出一种出租车热门区域功能发现方法。采用基于交通数据时空特性的出租车行驶数据聚类算法,实现热门区域划分。建立基于潜在Dirichlet分配的热门区域乘客出行特征发现模型,对具有相似乘客出行模式的出租车热门区域进行聚类。通过总结各热门区域的具体功能,发现在不同客流时间段内的区域功能与乘客出行模式间的关系。实验结果表明,该方法能够有效发现热门区域的功能特点。  相似文献   

17.
可视化技术通过图形表现数据的内在规律,并可利用交互的形式实现数据的层次化展示,其在分析交通数据、发现交通问题以及辅助决策中扮演着越来越重要的角色。为了更加清晰、直观地展示城市出租车GPS轨迹数据传递的信息,解决因其数据量庞大和时空信息复杂而带来的分析难题,提出一种集成聚集可视化、特征可视化对出租车GPS轨迹数据进行可视化分析的方法。首先,通过数据处理得到可用于可视化的特征数据,而后对乘客上下车点进行聚集可视化,并利用多视图协同交互的方法对轨迹数据进行了特征可视化;最后,根据可视化结果对城市出租车乘客出行特征时空分布情况进行了分析。在此基础上,设计了一个交互式可视分析系统,并通过真实数据集案例验证了系统的有效性。  相似文献   

18.
周红芳  赵雪涵  周扬 《计算机应用》2012,32(8):2182-2185
传统密度算法DBSCAN与DBRS的缺点在于时间性能和聚类精度均较低,为此,提出一种结合限定区域数据取样技术的密度聚类算法——DBLRS。该算法在不增加时间和空间复杂度的基础上利用参数Eps查找核心点的邻域点和扩展点,并在限定区域(Eps,2Eps)内进行数据抽样。实验结果表明,限定区域内选取代表点进行簇的扩充降低了大簇分裂的概率,提高了算法效率与聚类精度。  相似文献   

19.
出租车服务策略是出租车司机群体智慧的体现,隐藏在大规模的出租车GPS轨迹数据中.基于大数据分析工具,针对出租车GPS轨迹数据进行服务策略挖掘,提取好的服务策略指导司机营运可以提高司机收入和营运效率.乘客搜索策略是出租车服务策略的主要内容,在对GPS轨迹数据进行清洗之后导入HDFS,首先提取司机个人轨迹,并对其收入进行量化,然后对乘客搜索策略建模,根据模型利用hadoop平台统计出司机对各种策略的使用情况,结果表明,收入较高的司机在乘客搜索策略选择上与收入一般的司机有显著差异.  相似文献   

20.
针对出租车的异常轨迹检测问题,根据已有的出租车GPS数据,结合城市道路路口信息,提出了一种基于路口的异常轨迹检测算法(Intersection-Based Anomalous Trajectories Detection,IBATD)。该算法将GPS数据进行地图匹配,并将匹配后的GPS轨迹以路口的形式描述,再以多叉树的方式实现轨迹聚类。通过计算待测轨迹的轨迹概率,并与给定异常阈值进行比较,将轨迹分类为正常或异常。与经典的基于Hausdorff距离的谱聚类算法相比,多叉树轨迹聚类具有更准确的轨迹模型库、更快的运算速度以及实时检测的特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号