期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于Bi-LSTM的维吾尔语人称代词指代消解 总被引：1，自引：0，他引：1

田生伟秦越禹龙吐尔根&# 依布拉音冯冠军《电子学报》2018,46(7):1691-1699

针对维吾尔语人称代词指代现象,提出利用双向长短时记忆网络（Bi-directional long short term memory,Bi-LSTM）的深度学习机制进行基于深层语义信息的维吾尔语人称代词指代消解.首先将富含语义和句法信息的word embedding向量作为Bi-LSTM的输入,挖掘维吾尔语隐含的上下文语义层面特征;其次对维吾尔语人称代词指代现象进行探索,提取针对人称代词指代研究的24个hand-crafted特征;然后利用多层感知器（multilayer perception,MLP）融合Bi-LSTM学习到的上下文语义层面特征与hand-crafted特征;最后使用融合的两类特征训练softmax分类器完成维吾尔语人称代词指代消解任务.实验结果表明,充分利用两类特征的优势,维吾尔语人称代词指代消解的F1值达到76.86%.实验验证了Bi-LSTM与单向LSTM、浅层机器学习算法的SVM和ANN相比更具备挖掘隐含上下文深层语义信息的能力,而hand-crafted层面特征的引入,则有效提高指代消解性能. 相似文献

2.

基于深度强化学习的航天信息综合应用与决策研究

《无线电工程》2019,(7):564-570

随着我国航天技术的快速发展,包括导航、遥感和通信在内的航天资源越来越丰富,同时,国民经济和国防建设对航天信息的需求迫切,如何充分地应用航天信息和航天资源,成为一个新的研究内容。分析了航天信息应用的具体模式,采用深度强化学习的建模和优化方法,探索和研究了具体应用场景下的深度强化学习对应用需求的筹划和决策安排,从而在理论上验证了将人工智能方法应用于航天信息综合应用决策的可行性,为航天信息应用的大众化、平民化提供了支撑。通过仿真环境,测试在有限迭代范围内多个模型的优化速度。实验证明,在价值模型中选择Double DQN网络,其优化决策的收敛性能更好。相似文献

3.

云雾混合网络下基于多智能体架构的资源分配及卸载决策研究

陈前斌谭颀贺兰钦唐伦《电子与信息学报》2022,43(9):2654-2662

针对D2D辅助的云雾混合架构下资源分配及任务卸载决策优化问题,该文提出一种基于多智能体架构深度强化学习的资源分配及卸载决策算法.首先,该算法考虑激励约束、能量约束以及网络资源约束,联合优化无线资源分配、计算资源分配以及卸载决策,建立了最大化系统总用户体验质量(QoE)的随机优化模型,并进一步将其转化为MDP问题.其次,该算法将原MDP问题进行因式分解,并建立马尔可夫博弈模型.然后,基于行动者-评判家(AC)算法提出一种集中式训练、分布式执行机制.在集中式训练过程中,多智能体通过协作获取全局信息,实现资源分配及任务卸载决策策略优化,在训练过程结束后,各智能体独立地根据当前系统状态及策略进行资源分配及任务卸载.最后,仿真结果表明,该算法可以有效提升用户QoE,并降低了时延及能耗. 相似文献

4.

基于深度强化学习的智能决策方法

熊蓉玲段春怡冉华明杨萌冯旸赫《电讯技术》2023,(1):1-6

针对传统深度强化学习算法难以快速解决长时序复杂任务的问题,提出了一种引入历史信息和人类知识的深度强化学习方法,对经典近端策略优化(Proximal Policy Optimization, PPO)强化学习算法进行改进,在状态空间引入历史状态以反映环境的时序变化特征,在策略模型中基于人类认知增加无效动作掩膜,禁止智能体进行无效探索,提高探索效率,从而提升模型的训练性能。仿真结果表明,所提方法能够有效解决长时序复杂任务的智能决策问题,相比传统的深度强化学习算法可显著提高模型收敛效果。相似文献

5.

运营商网络中基于深度强化学习的服务功能链迁移机制

陈卓冯钢何颖周杨《电子与信息学报》2020,42(9):2173-2179

为改善运营商网络提供的移动服务体验,该文研究服务功能链(SFC)的在线迁移问题。首先基于马尔可夫决策过程(MDP)对服务功能链中的多个虚拟网络功能(VNF)在运营商网络中的驻留位置迁移进行模型化分析。通过将强化学习和深度神经网络相结合提出一种基于双深度Q网络(double DQN)的服务功能链迁移机制,该迁移方法能在连续时间下进行服务功能链的在线迁移决策并避免求解过程中的过度估计。实验结果表明,该文所提出的策略相比于固定部署算法和贪心算法在端到端时延和网络系统收益等方面优势明显,有助于运营商改善服务体验和资源的使用效率。相似文献

6.

图像指代分割研究综述

下载免费PDF全文

邱爽赵耀韦世奎《信号处理》2022,38(6):1144-1154

图像指代分割作为计算机视觉与自然语言处理交叉领域的热点问题,其目的是根据自然语言描述在图像中分割出相应的目标区域。随着相关深度学习技术的成熟和大规模数据集的出现,这项任务引起了研究者的广泛关注。本文对图像指代分割算法的发展进行了梳理和分析。首先根据多模态信息的编码解码方式,将现有图像指代分割算法分成基于多模态信息融合和基于多尺度信息融合两类进行了系统阐述,重点介绍了基于CNN-LSTM框架的方法、结构复杂的模块化方法和基于图的方法;然后,对用于图像指代分割任务的典型数据集和主流评价指标进行了总结与统计;之后,通过实验综合比较了现有的图像指代分割模型之间的性能差异并进一步验证了各种模型的优缺点。最后,对这一领域现有方法中存在的问题进行讨论分析,并对未来的发展方向进行了展望,表明了针对复杂的指代描述,需要通过多步、显式的推理步骤来解决图像指代分割问题。相似文献

7.

云雾混合网络下基于多智能体架构的资源分配及卸载决策研究

陈前斌谭颀贺兰钦唐伦《电子与信息学报》2021,43(9):2654-2662

针对D2D辅助的云雾混合架构下资源分配及任务卸载决策优化问题,该文提出一种基于多智能体架构深度强化学习的资源分配及卸载决策算法。首先,该算法考虑激励约束、能量约束以及网络资源约束,联合优化无线资源分配、计算资源分配以及卸载决策,建立了最大化系统总用户体验质量(QoE)的随机优化模型,并进一步将其转化为MDP问题。其次,该算法将原MDP问题进行因式分解,并建立马尔可夫博弈模型。然后,基于行动者-评判家(AC)算法提出一种集中式训练、分布式执行机制。在集中式训练过程中,多智能体通过协作获取全局信息,实现资源分配及任务卸载决策策略优化,在训练过程结束后,各智能体独立地根据当前系统状态及策略进行资源分配及任务卸载。最后,仿真结果表明,该算法可以有效提升用户QoE,并降低了时延及能耗。相似文献

8.

算网资源智能适配与融合调度方法

下载免费PDF全文

张维庭孙呈蕙王洪超代嘉宁《电信科学》2023,(9):12-20

为有效支撑网络和计算深度融合的发展需求,新型的算力网络架构应运而生。在此背景下,如何实现算网资源的智能感知以及计算任务的高效调度,是当前网络需要解决的关键问题。为此,分析了面向算网融合的新型网络场景,设计了计算任务与算力节点的调度模型,提出了一种基于深度强化学习的资源调度算法。所提算法通过感知用户设备、算网资源可用容量和链路状态等关键信息,能够智能地做出系统成本最小的调度决策。最后,通过仿真实验验证了所提算法在节约系统成本方面的有效性。相似文献

9.

基于改进深度强化学习的虚拟网络功能部署优化算法

唐伦贺兰钦连沁怡谭颀《电子与信息学报》2022,43(6):1724-1732

针对网络功能虚拟化/软件定义网络(NFV/SDN)架构下,网络服务请求动态到达引起的服务功能链(SFC)部署优化问题,该文提出一种基于改进深度强化学习的虚拟网络功能(VNF)部署优化算法.首先,建立了马尔科夫决策过程(MDP)的随机优化模型,完成SFC的在线部署以及资源的动态分配,该模型联合优化SFC部署成本和时延成本,同时受限于SFC的时延以及物理资源约束.其次,在VNF部署和资源分配的过程中,存在状态和动作空间过大,以及状态转移概率未知等问题,该文提出了一种基于深度强化学习的VNF智能部署算法,从而得到近似最优的VNF部署策略和资源分配策略.最后,针对深度强化学习代理通过ε贪婪策略进行动作探索和利用,造成算法收敛速度慢等问题,提出了一种基于值函数差异的动作探索和利用方法,并进一步采用双重经验回放池,解决经验样本利用率低的问题.仿真结果表示,该算法能够加快神经网络收敛速度,并且可以同时优化SFC部署成本和SFC端到端时延. 相似文献

10.

基于深度确定性策略梯度的虚拟网络功能迁移优化算法

唐伦贺兰钦谭颀陈前斌《电子与信息学报》2022,43(2):404-411

针对NFV/SDN架构下,服务功能链(SFC)的资源需求动态变化引起的虚拟网络功能(VNF)迁移优化问题,该文提出一种基于深度强化学习的VNF迁移优化算法.首先,在底层CPU、带宽资源和SFC端到端时延约束下,建立基于马尔可夫决策过程(MDP)的随机优化模型,该模型通过迁移VNF来联合优化网络能耗和SFC端到端时延.其次,由于状态空间和动作空间是连续值集合,提出一种基于深度确定性策略梯度(DDPG)的VNF智能迁移算法,从而得到近似最优的VNF迁移策略.仿真结果表明,该算法可以实现网络能耗和SFC端到端时延的折中,并提高物理网络的资源利用率. 相似文献

11.

Zero-anaphora resolution in Korean based on deep language representation model: BERT

Youngtae Kim Dongyul Ra Soojong Lim 《ETRI Journal》2021,43(2):299-312

It is necessary to achieve high performance in the task of zero anaphora resolution (ZAR) for completely understanding the texts in Korean, Japanese, Chinese, and various other languages. Deep-learning-based models are being employed for building ZAR systems, owing to the success of deep learning in the recent years. However, the objective of building a high-quality ZAR system is far from being achieved even using these models. To enhance the current ZAR techniques, we fine-tuned a pre-trained bidirectional encoder representations from transformers (BERT). Notably, BERT is a general language representation model that enables systems to utilize deep bidirectional contextual information in a natural language text. It extensively exploits the attention mechanism based upon the sequence-transduction model Transformer. In our model, classification is simultaneously performed for all the words in the input word sequence to decide whether each word can be an antecedent. We seek end-to-end learning by disallowing any use of hand-crafted or dependency-parsing features. Experimental results show that compared with other models, our approach can significantly improve the performance of ZAR. 相似文献

12.

协同边缘网络中智能计算卸载与资源优化算法

下载免费PDF全文

李斌徐天成《电讯技术》2023,63(12):1894-1901

针对具有依赖关系的计算密集型应用任务面临的卸载决策难题，提出了一种基于优先级的深度优先搜索调度策略。考虑到用户能量受限和移动性，构建了一种联合用户下行能量捕获和上行计算任务卸载的网络模型，并在此基础上建立了端到端优化目标函数。结合任务优先级及时延约束，利用深度强化学习自学习的优势，将任务卸载决策问题建模为马尔科夫模型，并设计了基于任务相关性的Dueling Double DQN(D3QN)算法对问题进行求解。仿真数据表明，所提算法较其他算法能够满足更多用户的时延要求，并能减少9%～10%的任务执行时延。相似文献

13.

基于DDPG的综合化航电系统多分区任务分配优化方法

赵长啸李道俊汪鹏辉田毅《电讯技术》2024,64(1):58-66

综合化航电系统（Integrated Modular Avionics,IMA）通过时空分区机制实现共享资源平台下的多航电功能集成,分区间的任务分配方法的优劣决定着航电系统的整体效能。针对航电任务集合在多分区内的分配调度问题,提出了一种基于深度强化学习的优化方法。构建了航电系统模型与任务模型,以系统资源限制与任务实时性需求为约束,以提高系统资源利用率为优化目标,将任务分配过程描述为序贯决策问题。引入马尔科夫决策模型,建立基于深度确定性策略梯度（Deep Deterministic Policy Gradient,DDPG）法的IMA任务分配模型并提出通用分配架构;引入状态归一化、行为噪声等策略训练技巧,提高DDPG算法的学习性能和训练能力。仿真结果表明,提出的优化算法迭代次数达到500次时开始收敛,分析800次之后多分区内驻留任务方案在能满足约束要求的同时,最低处理效率提升20.55%。相较于传统分配方案和AC(Actor-Critic)算法,提出的DDPG算法在收敛能力、优化性能以及稳定性上均有显著优势。相似文献

14.

Vehicle-following system based on deep reinforcement learning in marine scene

张新娄皓然蒋励肖前浩蔡著文《中国邮电高校学报(英文版)》2022,29(5):10-20

In order to solve the problems that the feature data type are not rich enough in the data collection process about the vehicle-following task in marine scene which results in a long model convergence time and high training difficulty, a two-stage vehicle-following system was proposed. Firstly, semantic segmentation model predicts the number of pixels of the followed target, then the number of pixels of the followed target is mapped to the position feature. Secondly, deep reinforcement learning algorithm enables the control equipment to make decision action, to ensure that two moving objects remain within the safe distance. The experimental results show that the two-stage vehicle-following system has a 40% faster convergence rate than the model without position feature, and the following stability is significantly improved by adding the position feature. 相似文献

15.

深度强化学习在物联网边缘计算中的应用研究

殷耀文《信息技术》2021,(1)

针对传统的物联网边缘计算方法存在计算成本过高,计算时间过长等问题,文中引入了深度强化学习技术,对物联网边缘计算方法进行优化。通过物联网拓扑结构设定物联网边缘计算周期,获取数据上传速度。设计边缘计算执行过程,提升边缘计算资源分配效率。引入深度强化学习技术中的CNN模型实现卷积计算,完成物联网边缘计算的资源分配。至此,实现了基于深度强化学习的物联网边缘计算优化。实验结果表明,设计法边缘计算方法具有较低的计算成本,计算时间也较短。说明在物联网边缘计算中融入深度强化学习技术可有效促进物联网技术的发展。相似文献

16.

基于卷积神经网络迁移学习的飞机目标识别

杨予昊孙晶明虞盛康《现代雷达》2019,41(12):35-39

飞机目标识别是地面情报系统的一项重要关键技术。近年来火热的深度学习方法,如卷积神经网络,展现出对于图像识别任务的优越性能。但是,训练卷积神经网络需要大量的带标签样本以估计规模庞大的模型参数,因而限制了其在雷达目标识别领域中的应用。针对飞机目标识别中的小样本问题,文中引入适用于有限数据场景的迁移学习技术,预先在其他大样本高分辨距离像数据上训练一个初始卷积神经网络模型,再结合当前飞机目标识别任务调优模型参数。在实测数据上的实验结果显示,与仅使用卷积神经网络的方法相比,所提方法可显著提升识别准确率,验证了方法的有效性。相似文献

17.

一种基于模型的可分解贝叶斯在线强化学习

下载免费PDF全文

仵博郑红燕冯延蓬陈鑫《电子学报》2014,42(7):1429-1434

针对贝叶斯强化学习中参数个数巨大,收敛速度慢,无法实现在线学习的问题,提出一种基于模型的可分解贝叶斯强化学习方法.首先,将学习参数进行可分解表示,降低学习参数的个数;然后,根据先验知识和观察数据采用贝叶斯方法来学习,最优化探索和利用二者之间的平衡关系;最后,采用基于点的贝叶斯强化学习方法实现学习过程的快速收敛,从而达到在线学习的目的.仿真结果表明该算法能够满足实时系统性能的要求. 相似文献

18.

基于深度强化学习的端到端无人驾驶决策

下载免费PDF全文

黄志清曲志伟张吉张严心田锐《电子学报》2000,48(9):1711-1719

端到端的驾驶决策是无人驾驶领域的研究热点.本文基于DDPG（Deep Deterministic Policy Gradient）的深度强化学习算法对连续型动作输出的端到端驾驶决策展开研究.首先建立基于DDPG算法的端到端决策控制模型,模型根据连续获取的感知信息（如车辆转角,车辆速度,道路距离等）作为输入状态,输出车辆驾驶动作（加速,刹车,转向）的连续型控制量.然后在TORCS（The Open Racing Car Simulator）平台下不同的行驶环境中进行训练并验证,结果表明该模型可以实现端到端的无人驾驶决策.最后与离散型动作输出的DQN（Deep Q-learning Network）模型进行对比分析,实验结果表明DDPG决策模型具有更优越的决策控制效果. 相似文献