排序方式: 共有71条查询结果,搜索用时 15 毫秒
61.
社会网络分析和社团信息挖掘的三项探索——挖掘虚拟社团的结构、核心和通信行为 总被引:12,自引:2,他引:12
社会网络分析是数据挖掘的新热点。文中综述了社会网络分析研究动态,介绍了作者近期在社会网络挖掘方面的三项探索,包括:(a)虚拟社团的结构挖掘,讨论了初始社团生成、权重计算,社团树生成和社团结构挖掘算法。(b) 基于六度分割和最短路径社团核心成员挖掘,讨论了计算节点间的最短路径,根据六度分割定理的剪枝,基于SPLINE算法和中心度挖掘犯罪子团伙中的核心的技术。(c)基于用户属性的通信行为挖掘,讨论了用户个性和通信行为关系的量化描述,采用911事件解密数据来建立社会网络,用于模拟恐怖分子间邮件的收发。 相似文献
62.
基于个性特征仿真邮件分析系统挖掘犯罪网络核心 总被引:7,自引:0,他引:7
数据挖掘应用于犯罪集团或恐怖组织社会网络分析是一种新兴的研究方法,国内外在分析犯罪和恐怖组织之间通信行为方面的研究工作亟待深入.为了模拟社会网络中个体利用电子邮件进行通信的规律,设计了一种基于个性特征的仿真邮件分析系统MEP,提出一种利用个性特征判别矩阵计算个性特征矢量各个维度权重的新方法,借助符合用户个性特征的正态分布模型模拟真实的邮件通信行为.为了挖掘犯罪网络的核心成员,提出了一种基于社会网络分析挖掘犯罪组织核心成员的算法CNKM(Crime Network Key Membermining),并利用时间序列分析方法对邮件的收发规律进行深入分析,发现异常通信事件.实验证明了该文提出的仿真邮件分析系统的有效性和实用性,模拟邮件通信的平均误差小于10%,并验证了CNKM算法的有效性. 相似文献
63.
索引是一种用于提高数据库查询效率的数据结构,良好执行计划的生成和选择很大程度上取决于数据表上是否存在合适的索引。然而,面对复杂的时空数据场景,现有的索引选择方法存在很多不足,如无法高效处理大量范围查询、容易造成索引冗余、无法有效应对动态的工作负载等问题。针对上述问题,提出一种新型基于深度确定策略梯度(Deep Deterministic Policy Gradient,DDPG)模型和索引效益评估网络的索引选择框架:ST-IS(Index Selection method tailored for Spatio-Temporal data scenarios)。ST-IS集成了对SQL语句和索引集的新型编码方法,有效避免索引冗余或索引缺失。ST-IS使用索引效益评估网络来优化强化学习的奖励机制,同时支持动态的工作负载。大量实验结果表明,在真实时空数据集和TPC-DS标准数据集上,ST-IS的性能优于现有的索引选择方法。 相似文献
64.
针对大多数空间众包(Spatial Crowdsourcing, SC)中任务分配算法缺乏考虑工人主观积极性的影响,提出了一种利用车联网(Internet of Vehicles, IoV)技术辅助积极性感知的SC任务分配框架(Task Allocation Framework in Spatial Crowdsourcing Based on Internet of Vehicles Assisted Positivity Sensing, IOV-SCA)来甄别消极工人并进行任务分配。IOV-SCA模型分为2个阶段:第1阶段利用部署在路侧单元上的Bi-PSM模型(Positivity Sensing Model Based on BiLSTM)来挖掘消极工人,旨在利用加入注意力机制的BiLSTM模型计算工作停滞时间并与给定阈值比较,从而辨别工人的积极性;第2阶段利用部署在云服务器上的PS-TAA算法(Task Allocation Algorithm Based on Positivity Sensing)进行任务分配,旨在激励工人的同时满足系统效用最大化。在真实数据集上进行大量对... 相似文献
65.
<正>内容导读“十四五”时期,我国由工业经济迈向数字经济,数据上升为新的生产要素,是国家基础性战略资源。如何精确地挖掘移动数据中潜在价值对推动数据产业快速发展至关重要。机器学习是人工智能的核心,涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域,机器学习技术能够帮助各个行业更好地从其主要应用场景所获取的海量数据中“挖掘”关键信息,实现图像分类、实体识别、轨迹预测、风险预测、目标检测、交通检测等重要功能。 相似文献
66.
67.
在大数据背景下,保证数据可信共享是数据联邦的基本要求.区块链技术代替传统的主从架构,可以提高联邦学习(federated learning,FL)的安全性.然而,现有工作中,模型参数验证与数据持久化所产生的巨大通信成本和存储消耗,已经成为数据联邦中亟待解决的问题.针对上述问题,设计了一种高效的去中心化联邦学习框架(efficient decentralized federated learning framework, EDFL),能够降低存储开销,并显著提升FL的学习效率.首先,提出了一种基于贡献度证明(proof-of-contribution)的共识机制,使得区块生成者的选举基于历史贡献度而不采用竞争机制,从而有效发避免了挖矿过程产生的区块生成延迟,并以异步方式缓解模型参数验证中的阻塞问题;其次,提出了一种角色自适应激励算法,因为该算法基于节点的工作强度和EDFL所分配的角色,所以能够激励合法节点更积极地进行模型训练,并有效地识别出恶意节点;再者,提出一种区块链分区存储策略,使得多重局部修复编码块(local reconstruction code)可被均匀地分布到网络的各个节点... 相似文献
68.
构建物联网产业生态圈在城市聚集资源要素和发挥特色优势中有着举足轻重的作用。通过对目前国内外物联网产业发展现状的总结与分析,从产业、技术、应用层面对物联网产业趋势进行预测,提出优势、劣势、机会和威胁层次分析过程(Strengths, Weaknesses, Opportunities, and Threats-Analytic Hierarchy Process, SWOT-AHP)模型,计算成都市物联网产业生态圈发展因素的权重。根据总体思路、目标、定位及重点四个方面提出成都市构建物联网产业生态圈的发展战略,从政府和企业两个侧重点提出可行的建议,为加快建设智慧城市、提升城市可持续发展能力、优化城市产业结构具有重要的现实意义。 相似文献
69.
综合征监测作为公共医疗卫生政策的主要检测指标,拥有充足且及时的监测信息至关重要。传统流行病学指标监测的滞后和误导会影响病情严重地区的医疗实施方案。使用谷歌趋势搜索量、谷歌移动、电信运营商、英国国家医疗服务体系(National Health Service,NHS)电话119和线上新冠检测请求网站的空间数据,提出一种局部范围内SARS-CoV-2传播和临床风险的早期指标建模方法。利用浅层学习算法作为基准方法训练局部空间神经网络,提出空间集成长短期记忆(Spatio-Integrated Long Short-Term Memory,SI-LSTM)算法和空间集成卷积神经网络长短期记忆(Spatio-Integrated Convolutional Neural Network Long Short-Term Memory,SI-CNN-LSTM)算法。在规定的评估时间周期内,两种算法均能准确识别出疫情感染高风险区域。此外,在基本公共卫生服务项目中,该模型还原了2020年底阿尔法变体、2021年4月德尔塔变体和2021年11月奥密克戎变体在英国境内的局部增长指数,其空间分散性和增长指数得到了临床数据的证实。 相似文献
70.
移动数据挖掘是智能交通领域中各项应用的研究基础,对于理解复杂的人类行为模式和改善城市规划、交通和公共安全有着巨大的潜力。行人轨迹预测立足于移动数据挖掘,从中发现行人的移动规律,致力于在智能机器人、自动驾驶、智慧旅游等许多现代产业中发挥重要作用。考虑到传统的行人轨迹预测模型仅关注时空数据,没有充分考虑人与环境、人与人之间的相互作用以及情景信息,提出了一种基于空间社会力图神经网络(Spatial Social Force Graph Neural Network,SSF-GNN)的行人轨迹预测模型。SSF-GNN可以处理行人的历史轨迹,并从不同场景中提取特征。利用社会力理论量化了行人的互动和情景感知信息。SSF-GNN融合了行人的社会影响和隐藏状态,可以准确预测连续轨迹点。在两个经典数据集(ETH和UCY)上进行了大量的实验,结果表明SSF-GNN的性能优于当前主流算法。平均位移误差(Average Displacement Error,ADE)相较于对比方法的平均值减小了25.6%,最终位移误差(Final Displacement Error,FDE)减小了15.4%。预测行人在未来3.2 s的轨迹点时,现有对比方法的平均准确率为48.6%,SSF-GNN的准确率显著优于最先进的模型,达到67.7%。 相似文献