какое самое тщательное исследование проводилось по поводу одного шага обратного распространения с nn interp? Я хочу статью, подобную "жизни обратного распространения", которая бы проводила меня по слоям, чтобы я мог точно следить за тем, что происходит.
Я хочу видеть каждое изменение веса, каждый побочный эффект от изучения новой концепции и т.д.
Я, по сути, хочу строительные блоки интерпретируемости, но для обратного распространения.
Я также хочу написать статью о чем-то вроде археологии модели, например, обучении inceptionv1 или чему-то подобному с нуля и визуализировать весь процесс, построить разные шаги grok, чтобы модель отслеживала каждую цепь и следила за ростом немецких знаний.
6,98K