Como os engenheiros da Databricks desenvolveram um sistema de limitação de taxa de alto desempenho. A equipe reconstruiu o sistema com fragmentação na memória e relatórios em lote orientados pelo cliente para obter imposição de baixa latência e alta taxa de transferência. Com essa abordagem, eles reduzem a latência da cauda em até 10x. Veja como eles fizeram isso: