Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeremy Howard
Jeremy Howard repostoval/a
Rozhovor se zakladatelem společnosti Kimi, Zhilin Yangem, je venku.
Opět si můžete nechat Kimiho přeložit za vás:) je tam spousta postřehů.
Několik záběrů:
1/ Zaměření základního modelu: K2 si klade za cíl být solidním základním modelem. Zjistili jsme, že růst vysoce kvalitních dat je pomalý a multimodální data výrazně nezvyšují textové "IQ". Proto se zaměřujeme na maximalizaci hodnoty každého datového tokenu – efektivity tokenu.
2/ Přeformulování dat: U 30T tokenů je jen malá část vysoce kvalitních dat (miliardy tokenů). Přeformulujeme je tak, aby byly pro model efektivnější a zlepšily zobecnění.
3/ Agentní schopnost: Naším cílem je posílit zobecnění. Největší výzvou je zajistit, aby model byl zobecněn nad rámec konkrétních úkolů. RL toto vylepšuje oproti jemnému doladění pod dohledem (SFT).
4/ Školení nativní pro AI: Zkoumáme další způsoby trénování modelů s nativní AI. Pokud umělá inteligence dokáže provádět dobrý výzkum zarovnání, bude lépe zobecňovat nad rámec optimalizace jednotlivých úkolů.
5/ RL vs SFT: Zobecnění RL je lepší, protože se učí ze vzorků politik, ale má své limity. RL pomáhá zlepšit konkrétní úlohy, ale je těžké zobecnit na všechny scénáře bez přizpůsobených úloh.
6/ Dlouhé kontexty: Délka kontextu je klíčová, potřebujeme miliony. Výzvou je vyvážit velikost modelu a délku kontextu pro optimální výkon, protože některé architektury se zlepšují s dlouhým kontextem, ale zhoršují se s krátkými.

60,67K
Cortesův doktorský titul mimochodem byl: "Predikce schopnosti zobecňovat u učících se strojů".

jack morris26. 8. 20:11
Nejprve jsem si myslel, že zákony o škálování pocházejí z OpenAI (2020)
pak jsem si myslel, že pocházejí z Baidu (2017)
Nyní jsem osvícený:
Zákony škálování byly poprvé zkoumány v Bellových laboratořích (1993)


16,69K
Pro lidi, kteří chtějí spravovat několik boxů, aniž by zvyšovali složitost, zvažte použití nástroje Cluster SSH, jako je ClusterShell nebo Fabric.
Pouze posílá příkazy ssh do skupin boxenů paralelně a ukazuje vám konsolidovaný výsledek.
Např


@levelsio23. 8. 06:57
Jakou aplikaci mám použít ke správě všech svých malých Hetznerových VPS?
Dnes jsem začal přecházet přes svůj první skutečný produkční web Remote OK z mého současného 12 let starého VPS (se všemi mými weby na něm jako Photo AI, Nomad List atd.) na nový Hetzner VPS
Každý web na svém vlastním malém VPS je můj plán
Ale chci něco, co to všechno spravuje, jako je kontrola zatížení serveru, využití disku, viz verze Ubuntu atd
Kokpit?
25,31K
IIUC, někdo prostě dostal entropix do práce a publikoval ho...

Jiawei Zhao23. 8. 04:00
Představujeme DeepConf: Hluboké myšlení s jistotou
🚀 První metoda, jak dosáhnout 99,9 % na AIME 2025 s open-source modely! Pomocí GPT-OSS-120B i bez nástrojů jsme dosáhli této téměř dokonalé přesnosti a zároveň jsme ušetřili až 85 % vygenerovaných tokenů.
Přináší také mnoho silných výhod pro paralelní myšlení:
🔥 Zvýšení výkonu: ~10% přesnost napříč modely a datovými sadami
⚡ Mimořádně efektivní: Až o 85 % méně vygenerovaných tokenů
🔧 Plug & play: Funguje s JAKÝMKOLI existujícím modelem - není potřeba žádné školení (také žádné ladění hyperparametrů!)
⭐ Snadné nasazení: Pouze ~50 řádků kódu ve vLLM (viz PR níže)
📚 Papír:
🌐 Projekt:
Společná práce s: @FuYichao123 , xuewei_wang, @tydsh
(podrobnosti viz v komentářích níže)
77,33K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější