Artikel in einem Konferenzbericht,

A Decentralized Policy with Logarithmic Regret for a Class of Multi-Agent Multi-Armed Bandit Problems with Option Unavailability Constraints and Stochastic Communication Protocols.

, , und .
CDC, Seite 5974-5979. IEEE, (2020)

Metadaten

Tags

Nutzer

  • @dblp

Kommentare und Rezensionen