Autor der Publikation

A Reinforcement Learning Algorithm Based on Minimum State Method and Average Reward.

, , , und . CSIE (5), Seite 534-538. IEEE Computer Society, (2009)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Application Prospect of Blockchain in Renewable Energy Certificates., , , und . CSAE, Seite 38:1-38:5. ACM, (2020)Learn to human-level control in dynamic environment using incremental batch interrupting temporal abstraction., , , , und . Comput. Sci. Inf. Syst., 13 (2): 561-577 (2016)Deep Deterministic Policy Gradient with Clustered Prioritized Sampling., , , und . ICONIP (2), Volume 11302 von Lecture Notes in Computer Science, Seite 645-654. Springer, (2018)基于视觉注意力机制的异步优势行动者-评论家算法 (Asynchronous Advantage Actor-Critic Algorithm with Visual Attention Mechanism)., , , und . 计算机科学, 46 (5): 169-174 (2019)A kernel based true online Sarsa(λ) for continuous space control problems., , , , und . Comput. Sci. Inf. Syst., 14 (3): 789-804 (2017)Study of Logistics Vehicle Routing Problem Based on GIS., , , , und . IITA, Seite 129-132. IEEE Computer Society, (2007)Detecting Wikipedia Vandalism with a Contributing Efficiency-Based Approach., , , , , und . WISE, Volume 7651 von Lecture Notes in Computer Science, Seite 645-651. Springer, (2012)Sparse Kernel-Based Least Squares Temporal Difference with Prioritized Sweeping., , , , , , und . ICONIP (3), Volume 9949 von Lecture Notes in Computer Science, Seite 221-230. (2016)Study on Competitive Intelligence System based on Web., , , , und . IITA, Seite 339-342. IEEE Computer Society, (2007)A Method to Automatically Discover and Classify Deep Web Data Source Using Multi-Classifier., , , und . CSIE (3), Seite 736-740. IEEE Computer Society, (2009)