¿Cuál es la investigación más exhaustiva que ha habido en un solo paso de backprop con nn interp, quiero un artículo como la vida de una retropropagación que me guíe capa por capa para poder seguir exactamente lo que sucede
Quiero ver cada peso que se ajusta, cada efecto fuera del objetivo de aprender un nuevo concepto, etc
Básicamente quiero los bloques de construcción de la interpretabilidad pero para la retroprop
También quiero un artículo sobre la arqueología de un modelo, como train inceptionv1 o lo que sea desde cero y visualizar todo, trazar diferentes pasos de grok, tener un modelo que supervise cada circuito y realice un seguimiento del crecimiento del conocimiento alemán
6.98K