¿Cuál es la investigación más exhaustiva que se ha realizado sobre un solo paso de retropropagación con nn interp? Quiero un artículo como "La vida de una retropropagación" que me guíe capa por capa para que pueda seguir exactamente lo que sucede.
Quiero ver cada peso que se ajusta, cada efecto fuera de objetivo de aprender un nuevo concepto, etc.
Básicamente, quiero los bloques de construcción de la interpretabilidad pero para el retropropagación.
También quiero un documento sobre la arqueología de un modelo, como entrenar inceptionv1 o lo que sea desde cero y visualizar todo, trazar diferentes pasos de grok, tener un modelo que monitoree cada circuito y mantenga un registro del crecimiento del conocimiento deutschiano.
6,98K