排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
利用历史数据训练强化学习推荐系统已经得到越来越多研究人员的关注,但是历史数据使得强化学习模型对状态-动作估值错误,产生数据偏差,如流行度偏差和选择偏差。造成上述问题的原因是历史数据分布与强化学习策略采集的数据分布不一致以及历史数据本身带有偏差。使用因果机制可以在约束策略采集数据分布的同时解决数据偏差的问题,提出基于因果机制约束的强化推荐系统,包含因果机制约束模块和对比策略模块。因果机制约束模块用于约束推荐策略可选择的样本空间以减少策略分布与数据分布误差,考虑随时间动态变化的物品流行度分布以缓解流行度偏差。对比策略模块通过平衡正负样本的重要性,缓解选择偏差的影响。在真实数据集Ciao和Epinions上的实验结果表明,相比深度Q网络(DQN)-r、GAIL、SOFA等,该算法具有较优的准确性和多样性,包含加入因果机制约束模块后的模型在F-measure指标上分别提高2%和3%,进一步验证了因果机制约束模块的有效性。 相似文献
2.
闫玉光 《中国新技术新产品》2009,(4):83-83
三相交流异步电动机的保护是个复杂的问题。在实际使用中,应按照电动机的容量、型式、控制方式和配电设备等不同来选择相适应的保护装置及起动设备。电动机的保护与控制关系 相似文献
3.
利用组态技术实现了涂装车间生产线的控制,介绍了系统的硬件结构,并对采用的网络结构进行了详细的解释,整个方案安全可靠、经济实用,投入使用后,在该涂装车间得到良好的反应。 相似文献
4.
闫玉光 《中国新技术新产品》2009,(2):93-93
WD-200镗床是60年代初期由苏联引进的重型机床,主轴直径200MM,最大镗孔深度1800MM,该机床适用于钻孔、扩孔、取芯钻(用空心钻钻削)及铰孔,以及进行平面加工,铣削平面、帽和进行线切割(螺纹加工),担负着我公司大件加工的生产任务。本文论述了对这一机床的电气系统进行改造的过程。 相似文献
5.
闫玉光 《中国新技术新产品》2009,(3):95-95
交流电动机固有的优点是:结构简单,造价低,坚固耐用,事故率低,容易维护;但它的最大缺点在于调速困难,简单调速方案的性能指标不佳,这只能够依靠交流调速理论的突破和调速装置的完善来解决。本文论述了交流调速传动的现状和发展 相似文献
1