Onderzoekslog Dag 0: DiLoCo Dagen Ik besloot een thesis te schrijven over gedistribueerde low-communication training. In wezen, hoe kunnen we grote modellen efficiënt trainen over gedistribueerde knooppunten zonder volledig verwoest te worden door netwerklatentie en bandbreedte? (1/n)