Tidak ada parit inferensi Belum sejak 2023 dengan kompilasi model dari obor 2.0 dan konsolidasi ke transformator dari DiT Nvidia kehilangan pasar inferensi jangka panjang secara batch untuk menurunkan TCO (AMD) dan real-time (TPU, ASICS)