Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nuevo récord de velocidad de entrenamiento CIFAR-10: 94% en 1.99 segundos en una A100
Récord anterior: 2.59 segundos (10 de noviembre de 2024)
Nuevo poseedor del récord: motor de descubrimiento algorítmico desarrollado por @hivergeai
Registro de cambios:
- Muon: Vectorizar NS iter y reducir la frecuencia del paso 'normalizar pesos'
1/3

- Datos de aumento: Añadir variación de color y vectorizar recorte aleatorio
- Compilación: Compilar xent fwd/bwd
- Arquitectura: Reemplazar GELU con SiLU, usar SVD para la inicialización de la primera capa y usar el formato channels_last con fp16 para todas las convoluciones
- Hparams: ajustes incluyendo bsz 2000 -> 1536 y épocas 8 -> 7.6
2/3
- TTA: Saltar para ejemplos fáciles
- Estrangulación térmica: Dormir durante 8s entre ejecuciones (solo afecta el promedio, no el tiempo récord)
Nota: Los autores informaron un tiempo de 2.02 segundos. Mi reproducción (torch 2.7.0; hardware visto abajo) tuvo un tiempo mínimo de 1.99s.
Código:
3/3

81,82K
Parte superior
Clasificación
Favoritos