关于单个反向传播步骤与 nn 插值的最全面的研究是什么?我想要一篇像《反向传播的生活》那样逐层讲解的论文,这样我就可以准确地跟随发生的事情。
我想看到每一个调整的权重,每一个学习新概念的偏差效果等等
我基本上想要可解释性的构建模块,但用于反向传播
我也想要一篇关于模型考古学的论文,比如从头开始训练 inceptionv1 或其他模型,并可视化整个过程,绘制不同的 grok 步骤,让一个模型监控每个电路,并跟踪德意志知识的增长。
6.98K