Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection
Matteo Papini;Andrea Tirinzoni;Marcello Restelli;Alessandro Lazaric;Matteo Pirotta
2021-01-01
File in questo prodotto:
Non ci sono file associati a questo prodotto.
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.