qual é a investigação mais completa que já houve em uma única etapa de backprop com nn interp, eu quero um artigo como a vida de uma retropropagação me guiando camada por camada para que eu possa acompanhar exatamente o que acontece
Eu quero ver como cada peso que é ajustado, cada efeito fora do alvo de aprender um novo conceito, etc
Basicamente, quero os blocos de construção da interpretabilidade, mas para backprop
Eu também quero um artigo sobre como a arqueologia de um modelo, como train inceptionv1 ou qualquer outra coisa do zero e visualizar a coisa toda, traçar diferentes etapas grok, ter um modelo monitorando cada circuito e acompanhar o crescimento do conhecimento alemão
6,99K