排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
深度强化学习善于解决控制的优化问题,连续动作的控制因为精度的要求,动作的数量随着动作维度的增加呈指数型增长,难以用离散的动作来表示。基于Actor-Critic框架的深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法虽然解决了连续动作控制问题,但是仍然存在采样方式缺乏科学理论指导、动作维度较高时的最优动作与非最优动作之间差距被忽视等问题。针对上述问题,提出一种基于DDPG算法的优化采样及精确评价的改进算法,并成功应用于选择顺应性装配机器臂(Selective Compliance Assembly Robot Arm,SCARA)的仿真环境中,与原始的DDPG算法对比,取得了良好的效果,实现了SCARA机器人快速自动定位。 相似文献
2.
3.
相机内外参数标定的准确性直接影响后期三维重建与真实被测物之间的相似性和三维点云的精度。针对该情况,提出了一种基于凸松弛多项式优化方法来对相机进行标定。该方法通过对优化问题中的高阶单项式进行线性化处理并添加相应的半正定矩阵约束,从而将原非凸优化问题转换为可以快速并准确求解的半正定规划问题,通过求解一次或多次的半正定规化问题来逼近或求解出原优化问题的全局最优解。实验数据证明了该方法的可行性与精确性。对于其他多视角几何中的多项式优化问题,该方法同样存在着良好的通用性与适应性。 相似文献
1