摘 要: | 针对强化学习DQN算法的三个优化因子(即Dueling、Double-Q以及Prioritized-replay)之间是否存在相互促进或抑制的关系,对三个优化因子之间进行随意组合作为交易策略进行研究,并将2020年9月2日至2022年9月2日期间雅虎金融网站上的HDFC银行股票的收盘价作为研究对象。研究结果发现,相较于基线模型,Dueling对股票短期收益预测最为贴合实际,并且对Double-Q与Prioritized-replay起到了促进作用;Prioritized-replay对Double-Q与Dueling起到了抑制作用,而Double-Q则对Prioritized-replay与Dueling未起到显著性改变。鉴于DQN算法在股票短期收益预测的随机性与预测精度的问题,其未来在金融预测领域将会有更好的应用前景。
|