Hoe Databricks-engineers een systeem voor rate limiting met hoge prestaties hebben ontwikkeld. Het team heeft het systeem opnieuw opgebouwd met in-memory sharding en client-gedreven batchrapportage om lage latentie en hoge doorvoerhandhaving te bereiken. Met deze aanpak hebben ze de tail latency met tot wel 10x verminderd. Zie hoe ze het hebben gedaan: