Baru-baru ini menemukan makalah yang memecahkan masalah penelitian saya sebelum saya bisa menyelesaikannya. berbagi karena *luar biasa* TLDR: rupanya Anda hanya dapat melatih 50K parameter dan mendapatkan kinerja yang baik dengan melatih hanya 1500 parameter sangat keren. Akhirnya, ini akan mengubah segalanya.