Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sincer, este o nebunie că am cei mai rapizi pixeli la cadrul de antrenament de învățare prin consolidare a politicilor din întreaga lume, la 100k triunghiuri și 16k rețele unice și 16k lumi unice.
Totul pe un singur 4090. 10 minute pentru sarcini ușoare
Sunt câteva lucruri grozave despre el. Interogări foarte rapide asupra atributelor lumii în raport cu pozițiile lucrurilor, atribute precum care este cea mai apropiată suprafață. Memoria nu explodează, poate scala până la 100 de lumi unice în memorie dacă aș vrea, prin punerea în comun a activelor. Generație procedurală live
Materiale plug and play pentru întreaga lume. Pot genera procedural lumi mesh cu manifoldcad dacă vreau și pot continua să generez lumi noi în timpul antrenamentului. O mulțime de politici se luptă cu memorarea, dar nu și a mea. Fiecare episod ar putea fi o lume nouă, dacă vreau să fie
Scheme de randare personalizate pentru a accelera antrenamentul. Pot face randări foveate, astfel încât să pot învăța un glob ocular real, care se zboară să-mi dau seama unde este poziționat agentul. Și chiar învață. 1m, 2m pași pe secundă. Cu două GPU-uri pot rula 12 experimente într-o oră
Pot obține percepția adâncimii gratuit datorită motorului meu mondial. Pot modela și fizica pe care o vreau prin injectarea unei funcții pytorch care grupează operațiunile în fiecare lume. *Pentru că* pot rula atât de multe experimente la viteze atât de extreme și este atât de configurabil, învăț atât de multe
Am antrenat un model să exploreze un apartament cu doar TREI interogări de profunzime. A fost ușor? Nu. A fost nevoie de multe experimente. Dar pentru că pot alerga 100 pe zi, fac de 100 de ori mai mult progres. Mi-am dat seama cum să-l țin corect *pentru că* progresul meu este de 100 de ori mai rapid decât al tău
Am cod care caută în grilă în fiecare unghi și am cod care redă comportamentul politicii și am cod care rulează statisticile pe toate și actualizează în direct un grafic pe care să-l urmăresc și am cod care rulează mai multe experimente pe mai multe mașini
Practic am lucrat la asta timp de 2 luni în total, perforat de hardware și firmware. Alergările mele de antrenament durau 10 ore, iar acum durează 10 minute. Nu cred că înțelegeți cu adevărat ce înseamnă asta. 10 minute
Mama mea obișnuia să scrie c++ pentru software-ul bancar tranzacțional în anii '90 și timpii ei de compilare erau mai lungi. Întreaga mea buclă de antrenament pe RENDERED WORLDS generată procedural este mai rapidă decât cât timp i-a luat mamei mele să ruleze teste de integrare pe software-ul tranzacțional al bazei de date
Mi-am rescris motorul de randare și integrarea trainerului (extensia pufferlib specifică doar pentru antrenamentul GPU, deci întreaga mea buclă rulează nativ pe GPU) și software-ul meu de vizualizare de experimentare / lansare și software-ul meu de generare a lumii de trei ori acum. Individual.
Viteza simplă a buclei mele face ca o grămadă de lucrări care nici măcar nu meritau încercate să merite făcute astăzi. Voi face atâtea prostii nefăcute până acum
Mi s-a spus că pixelii sunt o idee proastă pentru că sunt lenți, dar orice software poate fi făcut rapid. Nici măcar nu este atât de greu.
Nu cred că înțelegeți. Am antrenat o politică care folosește NIMIC ALTCEVA DECÂT PIXELI (!) CARE POATE GESTIONA FIZICA cu 4 canale de control care ÎȘI AMINTEȘTE LITERALMENTE CE CAMERE A VIZITAT DEJA și EVITĂ COLIZIUNILE la 20hz fără stare.
900k parametri
Înţelegi?
Voi câștiga.
Nu cu puțin. Nu făcând ceea ce fac toți ceilalți. Făcând ceea ce nimeni altcineva nu are curajul să facă. Doar să fac lucrul care este evident, aparent doar pentru mine
Voi câștiga

@ChrisRemboldt (da!)
26,65K
Limită superioară
Clasament
Favorite

