Claude 3.5 Sonnetリリース!性能や価格、使い方からGPT-4oとの比較まで徹底解説
6月21日、Anthropicから最新モデルClaude 3.5 Sonnetが発表されました。前世代モデルのClaude 3 Opusをはるかに超える性能をもっています。
この記事では、Claude 3.5 Sonnetの特徴や使い方、価格設定、さらにGPT-4oとの比較まで詳しく解説します。
Claude 3.5 Sonnetの概要&GPT-4oとの比較
Claude 3.5 Sonnetは、大学院レベルの推論(GPQA)、学部レベルの知識(MMLU)、コーディング熟練度(HumanEval)などのベンチマークで好成績を収めています。
さらに、ユーモアやニュアンスの理解、複雑な指示の解釈においても性能の向上を果たしています。さらに、自然な口調で高品質なコンテンツを生成する能力が強化されました。
Claude 3.5 Sonnetは、前世代のフラッグシップモデル「Claude 3 Opus」の2倍の速度で動作し、コストパフォーマンスも高くなっています。また、価格は前世代のミドルレンジのClaude 3 Sonnetと同じに設定されています。
自然言語による改善指示をもとに、オープンソースのコードベースに対するバグ修正や機能追加をする内部エージェントコーディング評価では、Claude 3.5 Sonnetは64%の問題を解決しました。
これは、38%しか解決できなかったClaude 3 Opusを大きく上回る結果です。
Anthropicが公開したベンチマークでは、MMLU(学部レベルの知識)やMATH(数学問題解決)などのタスクを除いて、Claude 3.5 Sonnetが他のモデルを上回る結果を示しています。
このベンチマーク結果によると、Claude 3.5 Sonnetは全体的に、OpenAIのフラッグシップモデルのGPT-4oや、GoogleのGemini 1.5 Pro、MetaのLlama-400bなどの他のモデルよりも高い性能を示しています。
さらに、視覚的な情報に関するベンチマークでも、Claude 3.5 Sonnetは良好な成績を収めています。
価格設定
Claude 3.5 Sonnetの料金は、入力は100万トークンあたり3ドル、出力は100万トークンあたり15ドルとなっており、200Kトークンのコンテキストウィンドウが利用可能です。
OpenAIのフラッグシップモデルであるGPT-4oは、入力が100万トークンあたり5ドル、出力が100万トークンあたり15ドルで、128Kトークンのコンテキストウィンドウが利用可能です。
つまり、Claude 3.5 SonnetはGPT-4oと比較して、より長いコンテキストウィンドウが利用でき、入力の価格が(スペックシート上では)安いという特徴があります。
ただし、GPT-4oは日本語におけるトークナイザーの最適化が施されており、消費するトークン数が削減されているため、実際に日本語で利用した場合にどちらが安いかは不明です。
Artifacts機能
新たに導入されたArtifacts機能により、コードスニペットやドキュメント、Webデザインなどの生成物を、専用ウィンドウでリアルタイムに確認、編集、構築できるようになります。
この機能は、プロジェクトやワークフローにAI生成コンテンツを利用する際に、より効率的な作業環境を提供します。
使い方
Claude 3.5 Sonnetは、無料でClaude.aiとClaude iOSアプリで利用可能です。記事執筆時点では、Claudeのチャットを利用した際にデフォルトでClaude 3.5 Sonnetが選択されるようになっていました。
また、Claude ProやTeamプランに加入している場合は、より高いレート制限で利用できます。
さらに、Anthropic API、Amazon Bedrock、Google Cloud Vertex AIからも利用できます。
まとめ
Claude 3.5 Sonnetは、前モデルのClaude 3 Opusを大きく上回る性能を持ち、GPT-4oなどの他のモデルと比較しても高い性能を示しています。
価格設定もGPT-4oと比較して入力が安く、より長いコンテキストウィンドウが利用できるため、コストパフォーマンスに優れています。
Claude 3.5 Sonnetは、自然言語処理や視覚的な情報処理において、高品質なコンテンツ生成や問題解決を行うための強力なツールとして期待されています。
Anthropicの今後の展開にも注目です。
参考
更新履歴
- 6月21日10時:GPT-4oは日本語におけるトークナイザーの最適化が施されていることを追記しました