Ngay cả với gradient theo lô đầy đủ, các bộ tối ưu hóa DL vẫn đi ngược lại lý thuyết tối ưu hóa cổ điển, vì chúng hoạt động ở *rìa của sự ổn định.* Cùng với @alex_damian_, chúng tôi giới thiệu "dòng chảy trung tâm": một công cụ lý thuyết để phân tích những động lực này, giúp đưa ra những dự đoán định lượng chính xác về các NN thực.