Jak přemýšlí GPT-5 s @OpenAI viceprezidentem pro výzkum @MillionInt
00:00 – Úvod
01:01 - Co vlastně znamená uvažování v AI
02:32 - Řetězec myšlenek: Modely myšlení ve slovech
05:25 – Jak modely rozhodují, jak dlouho přemýšlet
07:24 – Vývoj od o1 přes o3 až po GPT-5
11:00 - Cesta k OpenAI: Vyrůstání v Polsku, předčasné ukončení školní docházky, obchodování
20:32 - Práce na robotice a skládání Rubikovy kostky
23:02 - Den v životě: Rozhovory s výzkumníky
24:06 – Jak se určují priority výzkumu
26:53 – Kultura transparentnosti OpenAI
29:32 - Vyvážení výzkumu s rychlou expedicí
31:52 - Každodenní používání vlastních nástrojů OpenAI
32:43 – Pre-Training Plus RL: Moderní zásobník umělé inteligence
35:10 – Posilované učení 101: Výcvik psů
40:17 – Vývoj hlubokého zpětnovazebního učení
42:09 - Když se GPT-4 zprvu zdál být neohromující
45:39 - Jak RLHF udělal GPT-4 skutečně užitečným
48:02 – Učení bez dohledu vs. s učitelem
49:59 – GRPO a jak DeepSeek urychlil americký výzkum
53:05 – Co je potřeba ke škálování zpětnovazebního učení
55:36 - Agentická umělá inteligence a dlouhodobé myšlení
59:19 – Zarovnání jako problém RL
1:01:11 - Vítězství ve světovém finále ICPC bez specifického tréninku
1:05:53 – Použití RL nad rámec matematiky a kódování
1:09:15 - Cesta odtud do AGI
1:12:23 – Čisté RL vs jazykové modely