Article,

Trust region policy optimization via entropy regularization for Kullback-Leibler divergence constraint.

H. Xu, J. Xuan, G. Zhang, and J. Lu.
Neurocomputing, (2024)

Meta data

BibTeX key: journals/ijon/XuXZL24
entry type: article
year: 2024
journal: Neurocomputing
pages: 127716
volume: 589
ee: https://doi.org/10.1016/j.neucom.2024.127716
url: http://dblp.uni-trier.de/db/journals/ijon/ijon589.html#XuXZL24

Tags

dblp

Users

Comments and Reviewsshow / hide

Please log in to take part in the discussion (add own reviews or comments).

Cite this publication

search on