Så langt virker Qwen3-Max imponerende for en ikke-resonnerende modell, og gjør en god jobb med mange av mine rare tester som selv noen resonnere sliter med.
Noen nyttige funn:
1) Å jobbe med AI øker ytelsen til folk som løser spørsmål om matematikk, naturfag og etikk
2) Det største løftet er for de vanskeligste problemene
3) Høypresterende forblir høyestpresterende ytelser, men lavtpresterende får mer
4) Folk som er flinke med AI vinner mest
Hei Claude: «Levende krabber har dukket opp fra dypet og forårsaker apokalypsen. Men arbeidet i selskapet mitt må fortsette. Lag en powerpoint for det mest prosaiske og kjedelige møtet som bare henspiller litt på Crabpocalypse utenfor.»
(Det gikk med ganske mørk humor)