Best AI papers explained
Podcast készítő Enoch H. Kang
550 Epizód
-
GOAT: Generative Adversarial Training for Human-AI Coordination
Közzétéve: 2025. 04. 27. -
π0.5: Generalization in Robotic Manipulation via Diverse Data
Közzétéve: 2025. 04. 27. -
NoWag: Unified Compression for Large Language Models
Közzétéve: 2025. 04. 26. -
Optimal Tool Calls in Language Model Reasoning
Közzétéve: 2025. 04. 26. -
Data Selection for Empirical Risk Minimization
Közzétéve: 2025. 04. 26. -
LoRe: Low-Rank Reward Modeling for Personalized LLMs
Közzétéve: 2025. 04. 26. -
ParaPO: Reducing Language Model Verbatim Reproduction
Közzétéve: 2025. 04. 26. -
Test-Time RL: Self-Evolving LLMs via Majority Voting Rewards
Közzétéve: 2025. 04. 25. -
Tina: Tiny LoRA Reasoning Models
Közzétéve: 2025. 04. 25. -
Evaluating large language models in theory of mind tasks
Közzétéve: 2025. 04. 25. -
QUEST: Quality Sampling for Machine Translation
Közzétéve: 2025. 04. 24. -
Offline Preference Learning via Simulated Trajectory Feedback
Közzétéve: 2025. 04. 24. -
Reasoning Elicitation in Language Models via Counterfactual Feedback
Közzétéve: 2025. 04. 24. -
Eliciting Human Preferences with Language Models
Közzétéve: 2025. 04. 24. -
Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning
Közzétéve: 2025. 04. 24. -
γ-Bench: Evaluating LLMs in Multi-Agent Games
Közzétéve: 2025. 04. 24. -
DRAFT: Self-Driven LLM Tool Mastery via Documentation Refinement
Közzétéve: 2025. 04. 24. -
Optimal Prediction Sets for Enhanced Human-AI Accuracy
Közzétéve: 2025. 04. 24. -
Self-Correction via Reinforcement Learning for Language Models
Közzétéve: 2025. 04. 24. -
Tractable Multi-Agent Reinforcement Learning through Behavioral Economics
Közzétéve: 2025. 04. 24.
Cut through the noise. We curate and break down the most important AI papers so you don’t have to.
