DApp Store | Centrum Web3 pro události a hry

Populární témata

Matt Turck

Jak přemýšlí GPT-5 s @OpenAI viceprezidentem pro výzkum @MillionInt 00:00 – Úvod 01:01 - Co vlastně znamená uvažování v AI 02:32 - Řetězec myšlenek: Modely myšlení ve slovech 05:25 – Jak modely rozhodují, jak dlouho přemýšlet 07:24 – Vývoj od o1 přes o3 až po GPT-5 11:00 - Cesta k OpenAI: Vyrůstání v Polsku, předčasné ukončení školní docházky, obchodování 20:32 - Práce na robotice a skládání Rubikovy kostky 23:02 - Den v životě: Rozhovory s výzkumníky 24:06 – Jak se určují priority výzkumu 26:53 – Kultura transparentnosti OpenAI 29:32 - Vyvážení výzkumu s rychlou expedicí 31:52 - Každodenní používání vlastních nástrojů OpenAI 32:43 – Pre-Training Plus RL: Moderní zásobník umělé inteligence 35:10 – Posilované učení 101: Výcvik psů 40:17 – Vývoj hlubokého zpětnovazebního učení 42:09 - Když se GPT-4 zprvu zdál být neohromující 45:39 - Jak RLHF udělal GPT-4 skutečně užitečným 48:02 – Učení bez dohledu vs. s učitelem 49:59 – GRPO a jak DeepSeek urychlil americký výzkum 53:05 – Co je potřeba ke škálování zpětnovazebního učení 55:36 - Agentická umělá inteligence a dlouhodobé myšlení 59:19 – Zarovnání jako problém RL 1:01:11 - Vítězství ve světovém finále ICPC bez specifického tréninku 1:05:53 – Použití RL nad rámec matematiky a kódování 1:09:15 - Cesta odtud do AGI 1:12:23 – Čisté RL vs jazykové modely

Top

Hodnocení

Oblíbené