Autor der Publikation

ConceptMath: A Bilingual Concept-wise Benchmark for Measuring Mathematical Reasoning of Large Language Models.

, , , , , , , , , , , , und . ACL (Findings), Seite 6815-6839. Association for Computational Linguistics, (2024)

Bitte wählen Sie eine Person um die Publikation zuzuordnen

Um zwischen Personen mit demselben Namen zu unterscheiden, wird der akademische Grad und der Titel einer wichtigen Publikation angezeigt. Zudem lassen sich über den Button neben dem Namen einige der Person bereits zugeordnete Publikationen anzeigen.

 

Weitere Publikationen von Autoren mit dem selben Namen

Visual Encoding and Debiasing for CTR Prediction., , , , , , , , und . CIKM, Seite 4615-4619. ACM, (2022)Attention Estimation for Input Switch in Scalable Multi-display Environments., , und . ICONIP (4), Volume 9950 von Lecture Notes in Computer Science, Seite 329-336. (2016)MT-Bench-101: A Fine-Grained Benchmark for Evaluating Large Language Models in Multi-Turn Dialogues., , , , , , , , , und 1 andere Autor(en). ACL (1), Seite 7421-7454. Association for Computational Linguistics, (2024)Large-Scale Object Detection in the Wild From Imbalanced Multi-Labels., , , , , und . CVPR, Seite 9706-9715. Computer Vision Foundation / IEEE, (2020)GAIA: A Transfer Learning System of Object Detection That Fits Your Needs., , , , und . CVPR, Seite 274-283. Computer Vision Foundation / IEEE, (2021)DETR for Pedestrian Detection., , , , , , , und . CoRR, (2020)ConceptMath: A Bilingual Concept-wise Benchmark for Measuring Mathematical Reasoning of Large Language Models., , , , , , , , , und 3 andere Autor(en). ACL (Findings), Seite 6815-6839. Association for Computational Linguistics, (2024)GraphReader: Building Graph-based Agent to Enhance Long-Context Abilities of Large Language Models., , , , , , , , , und 2 andere Autor(en). CoRR, (2024)Online Learning of Multiple Tasks and Their Relationships : Testing on Spam Email Data and EEG Signals Recorded in Construction Fields., , , , , , und . CoRR, (2024)Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level., , , , , , und . CoRR, (2024)