トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Chubby♨️
GPT-5 とソネット 4.5 の比較。このテストでは、GPT-5 が明らかに勝者であると言えます。

Peter Gostev15時間前
Sonnet 4.5 と GPT-5 Pro の比較。
比較が公平ではないことは理解していますが、GPT-5 Pro ビデオは準備ができていますので、ご容赦ください。良いベンチマークを与えていると言っても、Sonnet 4.5の方が優れている例は1つもなかったと思いますし、Claude Codeでテストしていたので、Webクライアントでスタックしないという利点があったはずです。
Claude 4.5がすべての次元で悪化すると言うという意味ではなく、これらは1ショットの単一ファイルHTMLファイルであるため、エージェントの機能スイートを完全にテストするつもりはありません。
曲 経由 Suno v5
ソネット 4.5 の歌詞
7.92K
ソネット4.5は非常に良いモデルです。しかし、私が読んだことすべてから、それはまだGPT-5(高)の強さに匹敵しないようです。


Artificial Analysis9時間前
Anthropicの新しいClaude 4.5 Sonnetは、4.1 Opusを上回り、最もインテリジェントな#4モデルとなり、フロンティアインテリジェンスの競争でAnthropicをトップ3にランクインさせました
Claude 4.5 Sonnetは、Claude 4.1 OpusとClaude 4 Sonnetのユーザーに明確なアップグレードを提供し、Claude 4 Sonnetと同じ価格とトークン効率でより優れたインテリジェンスを提供します。Claude 4.5 Sonnetのトークン効率は、最大推論モードでも、GPT-5、Grok 4、Gemini 2.5 Proよりも多くのタスクに安価に使用できます。
ベンチマークの主なポイント:
➤ 🧠 Anthropic の最もインテリジェントなモデル: 推論モードでは、Claude 4.5 Sonnet は人工分析知能指数で 61 点を獲得しました。これは、2025年5月にリリースされたClaude 4 Sonnet (Thinking)から+4ポイント、Claude 4.1 Opus (Thinking)から+2ポイントのジャンプです。Claude 4.5 Sonnet (Thinking) は、Gemini 2.5 Pro (60) と Grok 4 Fast (60) を上回っていますが、GPT-5 (高、68) と Grok 4 (65) に次いでいます。
➤ 📈 最大の増加: τ²-Bench Telecom (+13 p.p.)、Humanity's Last Exam (+14 p.p.)、Humanity's Last Exam (+7 p.p.) で個々の評価スコアが最も大きく上昇しました。Claude 4.5 Sonnet は TerminalBench-Hard で Anthropic のこれまでで最高のスコアを達成しましたが、Claude 4.1 Opus と比較して +1 p.p しか獲得できず、Grok 4 と GPT-5 Codex (High.興味深いことに、Claude 4.5 Sonnetは、Artificial Analysis Intelligence Indexの10の評価において、どの個別評価でもまだ最高スコアを達成していません。
➤ ⚡ 非推論パフォーマンス: 非推論モードでは、Claude 4.5 ソネットは人工分析知能指数で 44 から 49 に跳ね上がりました。エージェントツールの使用が最も大きく改善されました (τ²-ベンチ テレコム スコアが 52% から 71% に増加) が、他の評価では改善が小さくなりました。
➤ ⚙️ トークン効率: Anthropic は、出力トークンの使用量を増やすことなく Claude の評価スコアを向上させ、Claude モデルは他のすべての推論モデルよりもトークン効率が高く続けています。Claude 4.5 Sonnet (Thinking) の場合 - 最大推論バジェット 64k トークンで評価 - Claude 4 Sonnet と比較して、人工分析知能インデックスを実行するためのトークン使用量が 43M から 42M にわずかに減少していることがわかります。これは、インテリジェンスの向上が出力トークンの使用量の増加と相関することが多い他のモデルのアップグレードとは異なります
➤ 💲 価格: Claude 4.5 Sonnet の価格は、Claude 4 Sonnet と同じで、1M 入力/出力トークンあたり 3 ドル/15 ドルです。これは、Claude 4.1 Opusと比較して、より魅力的なオプションであり、混合価格の1/5(入力と出力のトークン比率3:1)で思考モードでより高いインテリジェンスを提供します
主なモデルの詳細:
➤📏コンテキストウィンドウ:200Kトークン
➤🪙最大出力トークン:64Kトークン
➤ 🌐 可用性: Claude 4.5 Sonnet は、Anthropic の API、Google Vertex、Amazon Bedrock 経由で入手できます。Claude 4.5 Sonnetは、ClaudeとClaude Code(v2も本日リリースされました)からも利用できます

7.82K
トップ
ランキング
お気に入り