Policy Optimization as Online Learning with Mediator Feedback
Alberto Maria Metelli;Matteo Papini;Pierluca D'Oro;Marcello Restelli
2021-01-01
File in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
2012.08225.pdf
accesso aperto
:
Pre-Print (o Pre-Refereeing)
Dimensione
939.47 kB
Formato
Adobe PDF
|
939.47 kB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.