Autor der Publikation

Self-Explore to Avoid the Pit: Improving the Reasoning Capabilities of Language Models with Fine-grained Rewards.

, , , , und . CoRR, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Interactive Decision Making Environment for the Design Optimization of Climate Adaptive Building Shells., , und . CDVE, Volume 8091 von Lecture Notes in Computer Science, Seite 213-220. Springer, (2013)TLSM: Tiered Log-Structured Merge-Tree Utilizing Non-Volatile Memory., , , , und . IEEE Access, (2020)Vision-assisted deep stall landing for a fixed-wing UAV., und . J. Field Robotics, 39 (7): 1138-1152 (2022)Action Recognition Using Close-Up of Maximum Activation and ETRI-Activity3D LivingLab Dataset., , , und . Sensors, 21 (20): 6774 (2021)Coarse frequency offset estimation using a delayed auto-quadricorrelator in OFDM-based WLANs., , und . ICUMT, Seite 1-4. IEEE, (2011)One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning., , , , , , und . ICML, OpenReview.net, (2024)Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea., , , , , , , und . KDD, Seite 3466-3473. ACM, (2020)A cell current compensation scheme for 3D NAND FLASH memory., , , , , , , und . A-SSCC, Seite 1-4. IEEE, (2015)One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning., , , , , , und . CoRR, (2023)COVID-EENet: Predicting Fine-Grained Impact of COVID-19 on Local Economies., , , , , , und . AAAI, Seite 11971-11981. AAAI Press, (2022)