Uma entrevista muito perspicaz com um funcionário da $NVDA (também um ex-funcionário da $GOOGL) sobre o tema $NVDA/ASIC: 1. Ele não acha que a divisão entre $NVDA e ASICs nos próximos 5 anos será 50/50, mas mais como 80/20 ou 70/30 a favor da $NVDA. Ele acredita que os TPUs da $GOOGL trazem economia de custos, mas não acha que são tão eficientes quanto as GPUs da $NVDA. Ele menciona que, em uma base de token por segundo, um TPU está em torno de 1500-2000 tokens por segundo, enquanto um H100 está entre 2000-3500 tokens por segundo na configuração otimizada. 2. Ele dá exemplos de quando TPUs ou GPUs são bons para uso. Se você executasse a inferência do ChatGPT5 para consultas simples como desenho de imagens, ele acha que os TPUs seriam mais econômicos. Ele também menciona que estão vendo que a $GOOGL está oferecendo descontos significativos aos clientes para usar TPUs. 3. Ele menciona que, na sua visão, a xAI do Elon está construindo uma força de vendas tremenda e causando uma grande disrupção, e que o objetivo deles é vender computação e se tornar a $ORCL. 4. Ele diz que a $NVDA, em alguns casos, está colocando novas GPUs/aceleradores e recomprando os antigos dos clientes: »Se um cliente tem A100s e quer passar para H100s, nós recompraremos os servidores e os chips e depois os revenderemos no exterior.« 5. Ele sugere que acredita que a $CRWV será um »monstro absoluto« nos próximos 3-5 anos, pois está recebendo priorização da $NVDA. Ele também insinua alguns anúncios significativos na próxima GTC em outubro, especificamente do lado da fabricação nos EUA. encontrado em @AlphaSenseInc