基于一般化斜投影的异策略时序差分学习算法

PDF(2742298 KB)

南京大学学报(自然科学版) ›› 2017, Vol. 53 ›› Issue (6) : 1052.

作者信息 +

Off－policy linear temporal difference learning algorithms with a generalized oblique projection

Author information +

文章历史 +

导出引用

{{article.zuoZheCn_L}}. {{article.title_cn}}[J]. {{journal.qiKanMingCheng_CN}}, 2017, 53(6): 1052

{{article.zuoZheEn_L}}. {{article.title_en}}[J]. {{journal.qiKanMingCheng_EN}}, 2017, 53(6): 1052

中图分类号：

列表( 原文顺序 | 文献年度倒序 | 文中引用次数倒序 ) 可视化分析

编委：

主编：

责任编辑：

编辑:

PDF(2742298 KB)

Accesses

Citation

Detail

段落导航