nn interpを使用した単一のバックプロップステップについて行われた最も徹底的な調査は何ですか、何が起こるかを正確に追跡できるように、バックプロパゲーションの寿命をレイヤーごとに歩くような論文が欲しいです
調整されたすべてのウェイト、新しい概念を学ぶことによるすべてのオフターゲット効果などを確認したいです
私は基本的に解釈可能性の構成要素が欲しいが、バックプロップ用
また、train inceptionv1 などのモデルの考古学のような論文をゼロから作成し、全体を視覚化し、さまざまな grok ステップをプロットし、モデルにすべての回路を監視させ、ドイツ語の知識の成長を追跡したい
5.31K