Jak inżynierowie Databricks opracowali system ograniczania wydajności o wysokiej wydajności. Zespół przebudował system z wykorzystaniem shardingu w pamięci i raportowania wsadowego sterowanego przez klienta, aby osiągnąć niską latencję i wysoką przepustowość egzekwowania. Dzięki temu podejściu zredukowali latencję ogonową nawet o 10x. Zobacz, jak to zrobili: