Am întâlnit recent o lucrare care mi-a rezolvat problema de cercetare înainte de a putea termina. împărtășirea pentru că este *incredibilă* TLDR: se pare că poți antrena doar 50K parametri și obține performanțe bune antrenând doar 1500 de parametri foarte tare. În cele din urmă, acest lucru va schimba totul.