Best AI papers explained
Podcast készítő Enoch H. Kang
506 Epizód
-
Direct Preference Optimization with Unobserved Preference Heterogeneity: The Necessity of Ternary Preferences
Közzétéve: 2025. 10. 24. -
The Coverage Principle: How Pre-Training Enables Post-Training
Közzétéve: 2025. 10. 24. -
The Era of Real-World Human Interaction: RL from User Conversations
Közzétéve: 2025. 10. 24. -
Agent Learning via Early Experience
Közzétéve: 2025. 10. 24. -
Demystifying the Mechanisms Behind Emergent Exploration in Goal-conditioned RL
Közzétéve: 2025. 10. 22. -
Rewriting History: A Recipe for Interventional Analyses to Study Data Effects on Model Behavior
Közzétéve: 2025. 10. 22. -
A Definition of AGI
Közzétéve: 2025. 10. 22. -
Provably Learning from Language Feedback
Közzétéve: 2025. 10. 21. -
In-Context Learning for Pure Exploration
Közzétéve: 2025. 10. 21. -
On the Role of Preference Variance in Preference Optimization
Közzétéve: 2025. 10. 20. -
Training LLM Agents to Empower Humans
Közzétéve: 2025. 10. 20. -
Richard Sutton Declares LLMs a Dead End
Közzétéve: 2025. 10. 20. -
Demystifying Reinforcement Learning in Agentic Reasoning
Közzétéve: 2025. 10. 19. -
Emergent coordination in multi-agent language models
Közzétéve: 2025. 10. 19. -
Learning-to-measure: in-context active feature acquisition
Közzétéve: 2025. 10. 19. -
Andrej Karpathy's insights: AGI, Intelligence, and Evolution
Közzétéve: 2025. 10. 19. -
Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data
Közzétéve: 2025. 10. 18. -
Representation-Based Exploration for Language Models: From Test-Time to Post-Training
Közzétéve: 2025. 10. 18. -
The attacker moves second: stronger adaptive attacks bypass defenses against LLM jail- Breaks and prompt injections
Közzétéve: 2025. 10. 18. -
When can in-context learning generalize out of task distribution?
Közzétéve: 2025. 10. 16.
Cut through the noise. We curate and break down the most important AI papers so you don’t have to.
