From post

копировать удалить добавить публикацию в буфер
Запись сообщества
посмотреть историю данной записи
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

Quantifying Generalization in Reinforcement Learning.

K. Cobbe, O. Klimov, C. Hesse, T. Kim, и J. Schulman. ICML, том 97 из Proceedings of Machine Learning Research, стр. 1282-1289. PMLR, (2019)

Please choose a person to relate this publication to

To differ between persons with the same name, the academic degree and the title of an important publication will be displayed.

Jurriaan Schulman

Hermann John

Christian John

Dirk Max Johns

Другие публикации лиц с тем же именем

Scaling laws for single-agent reinforcement learning.J. Hilton, J. Tang, и J. Schulman. CoRR, (2023)Learning Complex Dexterous Manipulation with Deep Reinforcement Learning and Demonstrations.A. Rajeswaran, V. Kumar, A. Gupta, J. Schulman, E. Todorov, и S. Levine. CoRR, (2017)Learning Complex Dexterous Manipulation with Deep Reinforcement Learning and Demonstrations.A. Rajeswaran, V. Kumar, A. Gupta, G. Vezzani, J. Schulman, E. Todorov, и S. Levine. Robotics: Science and Systems, (2018)Training language models to follow instructions with human feedback.L. Ouyang, J. Wu, X. Jiang, D. Almeida, C. Wainwright, P. Mishkin, C. Zhang, S. Agarwal, K. Slama, A. Ray и 10 other автор(ы). NeurIPS, (2022)OpenAI GymG. Brockman, V. Cheung, L. Pettersson, J. Schneider, J. Schulman, J. Tang, и W. Zaremba. (2016)cite arxiv:1606.01540.Let's Verify Step by Step.H. Lightman, V. Kosaraju, Y. Burda, H. Edwards, B. Baker, T. Lee, J. Leike, J. Schulman, I. Sutskever, и K. Cobbe. ICLR, OpenReview.net, (2024)Model-Based Reinforcement Learning via Meta-Policy Optimization.I. Clavera, J. Rothfuss, J. Schulman, Y. Fujita, T. Asfour, и P. Abbeel. CoRL, том 87 из Proceedings of Machine Learning Research, стр. 617-629. PMLR, (2018)Policy Gradient Search: Online Planning and Expert Iteration without Search Trees.T. Anthony, R. Nishihara, P. Moritz, T. Salimans, и J. Schulman. CoRR, (2019)Distribution Augmentation for Generative Modeling.H. Jun, R. Child, M. Chen, J. Schulman, A. Ramesh, A. Radford, и I. Sutskever. ICML, том 119 из Proceedings of Machine Learning Research, стр. 5006-5019. PMLR, (2020)Phasic Policy Gradient.K. Cobbe, J. Hilton, O. Klimov, и J. Schulman. ICML, том 139 из Proceedings of Machine Learning Research, стр. 2020-2027. PMLR, (2021)

BibSonomy

Disambiguation

Please choose a person to relate this publication to

Jurriaan Schulman

Jurriaan Schulman

Hermann John

Christian John

Dirk Max Johns

Другие публикации лиц с тем же именем

Disambiguation

BibSonomy

Disambiguation

копироватьудалитьдобавить публикацию в буферЗапись сообществапосмотреть историю данной записиURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML Quantifying Generalization in Reinforcement Learning.

Please choose a person to relate this publication to

Jurriaan Schulman

Jurriaan Schulman

Hermann John

Christian John

Dirk Max Johns

Другие публикации лиц с тем же именем

Disambiguation