• Kezdőlap
  • Podcastok
  • Rangsor

John Schulman

TalkRL: The Reinforcement Learning Podcast - Podcast készítő Robin Ranjit Singh Chauhan

Kategóriák:

Technológia

John Schulman, OpenAI cofounder and researcher, inventor of PPO/TRPO talks RL from human feedback, tuning GPT-3 to follow instructions (InstructGPT) and answer long-form questions using the internet (WebGPT), AI alignment, AGI timelines, and more!

Visit the podcast's native language site

  • Az összes podcast
  • Epizódok
  • Blog
  • Rólunk
  • Adatvédelmi irányelvek
  • Mi az a podcast?
  • Hogyan hallgassunk podcastot?

© Podcast365.hu 2025