Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI heeft zijn PhD en is nu op de arbeidsmarkt.
Introductie van de AI Productiviteitsindex (APEX), een benchmark die meet hoe goed we de meest waardevolle industrieën ter wereld hebben geautomatiseerd.
De meeste benchmarks bestuderen abstracte capaciteiten. APEX evalueert de modelprestaties op echte leveringen in de rechtsgeleerdheid, financiën, consulting en geneeskunde.
De modellen die vandaag de dag het meest in staat zijn om werk te verrichten, volgens APEX:
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 Flash
Andere bevindingen:
- GPT 5 toont de sterkste prestaties in alle 4 domeinen
- Sommige goedkopere modellen presteren beter dan duurdere modellen van dezelfde aanbieder (bijv. Gemini 2.5 Flash vs. Gemini 2.5 Pro)
- Het beste open source model, Qwen (7e), presteert slechts 2% achter Grok 4 in het algemeen
Boven
Positie
Favorieten

