金海峡-Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的回报

['总和', '最大值', '最小值', '期望值']

自适应图片

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处: