分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

Chubby♨️

ソネット4.5は非常に良いモデルです。しかし、私が読んだことすべてから、それはまだGPT-5(高)の強さに匹敵しないようです。

Anthropicの新しいClaude 4.5 Sonnetは、4.1 Opusを上回り、最もインテリジェントな#4モデルとなり、フロンティアインテリジェンスの競争でAnthropicをトップ3にランクインさせました Claude 4.5 Sonnetは、Claude 4.1 OpusとClaude 4 Sonnetのユーザーに明確なアップグレードを提供し、Claude 4 Sonnetと同じ価格とトークン効率でより優れたインテリジェンスを提供します。Claude 4.5 Sonnetのトークン効率は、最大推論モードでも、GPT-5、Grok 4、Gemini 2.5 Proよりも多くのタスクに安価に使用できます。ベンチマークの主なポイント: ➤ 🧠 Anthropic の最もインテリジェントなモデル: 推論モードでは、Claude 4.5 Sonnet は人工分析知能指数で 61 点を獲得しました。これは、2025年5月にリリースされたClaude 4 Sonnet (Thinking)から+4ポイント、Claude 4.1 Opus (Thinking)から+2ポイントのジャンプです。Claude 4.5 Sonnet (Thinking) は、Gemini 2.5 Pro (60) と Grok 4 Fast (60) を上回っていますが、GPT-5 (高、68) と Grok 4 (65) に次いでいます。 ➤ 📈 最大の増加: τ²-Bench Telecom (+13 p.p.)、Humanity's Last Exam (+14 p.p.)、Humanity's Last Exam (+7 p.p.) で個々の評価スコアが最も大きく上昇しました。Claude 4.5 Sonnet は TerminalBench-Hard で Anthropic のこれまでで最高のスコアを達成しましたが、Claude 4.1 Opus と比較して +1 p.p しか獲得できず、Grok 4 と GPT-5 Codex (High.興味深いことに、Claude 4.5 Sonnetは、Artificial Analysis Intelligence Indexの10の評価において、どの個別評価でもまだ最高スコアを達成していません。 ➤ ⚡ 非推論パフォーマンス: 非推論モードでは、Claude 4.5 ソネットは人工分析知能指数で 44 から 49 に跳ね上がりました。エージェントツールの使用が最も大きく改善されました (τ²-ベンチテレコムスコアが 52% から 71% に増加) が、他の評価では改善が小さくなりました。 ➤ ⚙️ トークン効率: Anthropic は、出力トークンの使用量を増やすことなく Claude の評価スコアを向上させ、Claude モデルは他のすべての推論モデルよりもトークン効率が高く続けています。Claude 4.5 Sonnet (Thinking) の場合 - 最大推論バジェット 64k トークンで評価 - Claude 4 Sonnet と比較して、人工分析知能インデックスを実行するためのトークン使用量が 43M から 42M にわずかに減少していることがわかります。これは、インテリジェンスの向上が出力トークンの使用量の増加と相関することが多い他のモデルのアップグレードとは異なります ➤ 💲 価格: Claude 4.5 Sonnet の価格は、Claude 4 Sonnet と同じで、1M 入力/出力トークンあたり 3 ドル/15 ドルです。これは、Claude 4.1 Opusと比較して、より魅力的なオプションであり、混合価格の1/5(入力と出力のトークン比率3:1)で思考モードでより高いインテリジェンスを提供します主なモデルの詳細: ➤📏コンテキストウィンドウ:200Kトークン ➤🪙最大出力トークン:64Kトークン ➤ 🌐 可用性: Claude 4.5 Sonnet は、Anthropic の API、Google Vertex、Amazon Bedrock 経由で入手できます。Claude 4.5 Sonnetは、ClaudeとClaude Code(v2も本日リリースされました)からも利用できます

トップ

ランキング

お気に入り