Selbst mit Vollbatch-Gradienten widersprechen DL-Optimierer der klassischen Optimierungstheorie, da sie am *Rand der Stabilität* operieren. Mit @alex_damian_ führen wir "zentrale Flüsse" ein: ein theoretisches Werkzeug zur Analyse dieser Dynamik, das genaue quantitative Vorhersagen über reale NNs trifft.