Ich habe kürzlich ein Papier entdeckt, das mein Forschungsproblem gelöst hat, bevor ich es beenden konnte. Teile es, weil es *unglaublich* ist TLDR: Offensichtlich kann man nur 50K Parameter trainieren und erhält gute Leistungen, indem man nur 1500 Parameter trainiert. Sehr cool. Letztendlich wird das alles verändern.