Inproceedings,

Q-Learning Lagrange Policies for Multi-Action Restless Bandits.

J. Killian, A. Biswas, S. Shah, and M. Tambe.
KDD, page 871-881. ACM, (2021)

Meta data

BibTeX key: conf/kdd/KillianBST21
entry type: inproceedings
booktitle: KDD
year: 2021
pages: 871-881
publisher: ACM
crossref: conf/kdd/2021
ee: https://doi.org/10.1145/3447548.3467370
isbn: 978-1-4503-8332-5
url: http://dblp.uni-trier.de/db/conf/kdd/kdd2021.html#KillianBST21

Tags

dblp

Users

Comments and Reviewsshow / hide

Please log in to take part in the discussion (add own reviews or comments).

Cite this publication

search on