Autor der Publikation

A Reinforcement Learning Algorithm Based on Minimum State Method and Average Reward.

, , , und . CSIE (5), Seite 534-538. IEEE Computer Society, (2009)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.


Weitere Publikationen von Autoren mit dem selben Namen

Deep Deterministic Policy Gradient with Clustered Prioritized Sampling., , , und . ICONIP (2), Volume 11302 von Lecture Notes in Computer Science, Seite 645-654. Springer, (2018)Application Prospect of Blockchain in Renewable Energy Certificates., , , und . CSAE, Seite 38:1-38:5. ACM, (2020)Hierarchical Reinforcement Learning With Automatic Sub-Goal Identification., , , und . IEEE CAA J. Autom. Sinica, 8 (10): 1686-1696 (2021)A Kernel-Based Sarsa( ) Algorithm with Clustering-Based Sample Sparsification., , , , , , und . ICONIP (3), Volume 9949 von Lecture Notes in Computer Science, Seite 211-220. (2016)Study on Competitive Intelligence System based on Web., , , , und . IITA, Seite 339-342. IEEE Computer Society, (2007)A Method to Automatically Discover and Classify Deep Web Data Source Using Multi-Classifier., , , und . CSIE (3), Seite 736-740. IEEE Computer Society, (2009)CoProLITE: Constrained Proxy Learning for lIver and hepaTic lesion sEgmentation., , , , , und . Neurocomputing, (2024)A kernel based true online Sarsa(λ) for continuous space control problems., , , , und . Comput. Sci. Inf. Syst., 14 (3): 789-804 (2017)Sparse Kernel-Based Least Squares Temporal Difference with Prioritized Sweeping., , , , , , und . ICONIP (3), Volume 9949 von Lecture Notes in Computer Science, Seite 221-230. (2016)Study of Logistics Vehicle Routing Problem Based on GIS., , , , und . IITA, Seite 129-132. IEEE Computer Society, (2007)