PAPINI, MATTEO

	Nome completo
	
					PAPINI, MATTEO
				
	Afferenza
	
					DIPARTIMENTO DI ELETTRONICA, INFORMAZIONE E BIOINGEGNERIA
				
	Pagina personale
	
Scheda docente sul sito di Ateneo

Mostra records

Risultati 1 - 20 di 26 (tempo di esecuzione: 0.017 secondi).

Adaptive Batch Size for Safe Policy Gradients

2017-01-01 Papini, Matteo; Pirotta, M.; Restelli, M.

Balancing Learning Speed and Stability in Policy Gradient via Adaptive Exploration

2020-01-01 Papini, M.; Battistello, A.; Restelli, M.

Convergence Analysis of Policy Gradient Methods with Dynamic Stochasticity

2025-01-01 Montenegro, A.; Mussi, M.; Papini, M.; Metelli, A. M.

Feature Selection via Mutual Information: New Theoretical Insights

2019-01-01 Beraha, M.; Metelli, A. M.; Papini, M.; Tirinzoni, A.; Restelli, M.

Gradient-Aware Model-Based Policy Search

2020-01-01 D'Oro, Pierluca; Metelli, ALBERTO MARIA; Tirinzoni, Andrea; Papini, Matteo; Restelli, Marcello

Importance Sampling Techniques for Policy Optimization

2020-01-01 Metelli, ALBERTO MARIA; Papini, Matteo; Montali, Nico; Restelli, Marcello

Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning

2024-01-01 Montenegro, Alessandro; Mussi, Marco; Papini, Matteo; Metelli, ALBERTO MARIA

Learning Optimal Deterministic Policies with Stochastic Policy Gradients

2024-01-01 Montenegro, Alessandro; Mussi, Marco; Metelli, ALBERTO MARIA; Papini, Matteo

Leveraging Good Representations in Linear Contextual Bandits

2021-01-01 Papini, Matteo; Tirinzoni, Andrea; Restelli, Marcello; Lazaric, Alessandro; Pirotta, Matteo

Lifting the Information Ratio: An Information-Theoretic Analysis of Thompson Sampling for Contextual Bandits

2022-01-01 Neu, G.; Papini, M.; Olkhovskaya, J.; Schwartz, L.

Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPs

2024-01-01 Maran, Davide; Metelli, Alberto Maria; Papini, Matteo; Restelli, Marcello

No-Regret Reinforcement Learning in Smooth MDPs

2024-01-01 Maran, Davide; Metelli, ALBERTO MARIA; Papini, Matteo; Restelli, Marcello

Online Learning with Off-Policy Feedback

2023-01-01 Gabbianelli, G.; Neu, G.; Papini, M.

Online Learning with Off-Policy Feedback in Adversarial MDPs

2024-01-01 Bacchiocchi, F.; Stradi, Fe.; Papini, M.; Metelli, Am.; Gatti, N.

Optimistic Policy Optimization via Multiple Importance Sampling

2019-01-01 Papini, Matteo; Metelli, Alberto Maria; Lupo, Lorenzo; Restelli, Marcello

Policy Gradient Methods with Adaptive Policy Spaces

2024-01-01 Tedeschi, Gianmarco; Papini, Matteo; Metelli, Alberto Maria; Restelli, Marcello

Policy Optimization as Online Learning with Mediator Feedback

2021-01-01 Metelli, ALBERTO MARIA; Papini, Matteo; D'Oro, Pierluca; Restelli, Marcello

Policy optimization via importance sampling

2018-01-01 Metelli, A. M.; Papini, M.; Faccio, F.; Restelli, M.

Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs