Claude 3.5 Sonnetリリース！性能や価格、使い方からGPT-4oとの比較まで徹底解説

投稿日： 2024年06月21日 02:07 更新日： 2024年06月21日 10:00

6月21日、Anthropicから最新モデルClaude 3.5 Sonnetが発表されました。前世代モデルのClaude 3 Opusをはるかに超える性能をもっています。

この記事では、Claude 3.5 Sonnetの特徴や使い方、価格設定、さらにGPT-4oとの比較まで詳しく解説します。

Claude 3.5 Sonnetの概要＆GPT-4oとの比較

Claude 3.5 Sonnetは、大学院レベルの推論（GPQA）、学部レベルの知識（MMLU）、コーディング熟練度（HumanEval）などのベンチマークで好成績を収めています。

さらに、ユーモアやニュアンスの理解、複雑な指示の解釈においても性能の向上を果たしています。さらに、自然な口調で高品質なコンテンツを生成する能力が強化されました。

Claude 3.5 Sonnetは、前世代のフラッグシップモデル「Claude 3 Opus」の2倍の速度で動作し、コストパフォーマンスも高くなっています。また、価格は前世代のミドルレンジのClaude 3 Sonnetと同じに設定されています。

自然言語による改善指示をもとに、オープンソースのコードベースに対するバグ修正や機能追加をする内部エージェントコーディング評価では、Claude 3.5 Sonnetは64%の問題を解決しました。

これは、38%しか解決できなかったClaude 3 Opusを大きく上回る結果です。

Anthropicが公開したベンチマークでは、MMLU（学部レベルの知識）やMATH（数学問題解決）などのタスクを除いて、Claude 3.5 Sonnetが他のモデルを上回る結果を示しています。

このベンチマーク結果によると、Claude 3.5 Sonnetは全体的に、OpenAIのフラッグシップモデルのGPT-4oや、GoogleのGemini 1.5 Pro、MetaのLlama-400bなどの他のモデルよりも高い性能を示しています。

GPT-4oの概要から使い方まで徹底解説！OpenAIの次世代フラッグシップモデル

2024年5月13日、OpenAIは次世代のフラッグシップモデルであるGPT-4oを発表しました。この記事では、GPT-4oの概要から使い方までを徹底解説します。

Google Gemini 1.5リリース！コンテキストウィンドウ拡大と高効率アーキテクチャで性能が大幅に向上

Googleがマルチモーダルな大規模言語モデル（LLM）のGemini 1.5をリリースしました。今回のリリースは、先日のGemini Advancedの公開に続くものです。また、AI StudioおよびVertex AIのGemini APIを通して1.0 Ultraを利用できるようになりました。この記事では、Googleの次世代モデルである「Gemini 1.5」について深堀りします。

さらに、視覚的な情報に関するベンチマークでも、Claude 3.5 Sonnetは良好な成績を収めています。

価格設定

Claude 3.5 Sonnetの料金は、入力は100万トークンあたり3ドル、出力は100万トークンあたり15ドルとなっており、200Kトークンのコンテキストウィンドウが利用可能です。

OpenAIのフラッグシップモデルであるGPT-4oは、入力が100万トークンあたり5ドル、出力が100万トークンあたり15ドルで、128Kトークンのコンテキストウィンドウが利用可能です。

つまり、Claude 3.5 SonnetはGPT-4oと比較して、より長いコンテキストウィンドウが利用でき、入力の価格が（スペックシート上では）安いという特徴があります。

ただし、GPT-4oは日本語におけるトークナイザーの最適化が施されており、消費するトークン数が削減されているため、実際に日本語で利用した場合にどちらが安いかは不明です。

Artifacts機能

新たに導入されたArtifacts機能により、コードスニペットやドキュメント、Webデザインなどの生成物を、専用ウィンドウでリアルタイムに確認、編集、構築できるようになります。

この機能は、プロジェクトやワークフローにAI生成コンテンツを利用する際に、より効率的な作業環境を提供します。

使い方

Claude 3.5 Sonnetは、無料でClaude.aiとClaude iOSアプリで利用可能です。記事執筆時点では、Claudeのチャットを利用した際にデフォルトでClaude 3.5 Sonnetが選択されるようになっていました。

また、Claude ProやTeamプランに加入している場合は、より高いレート制限で利用できます。

さらに、Anthropic API、Amazon Bedrock、Google Cloud Vertex AIからも利用できます。

まとめ

Claude 3.5 Sonnetは、前モデルのClaude 3 Opusを大きく上回る性能を持ち、GPT-4oなどの他のモデルと比較しても高い性能を示しています。

価格設定もGPT-4oと比較して入力が安く、より長いコンテキストウィンドウが利用できるため、コストパフォーマンスに優れています。

Claude 3.5 Sonnetは、自然言語処理や視覚的な情報処理において、高品質なコンテンツ生成や問題解決を行うための強力なツールとして期待されています。

Anthropicの今後の展開にも注目です。

参考

Introducing Claude 3.5 Sonnet \ Anthropic

更新履歴

6月21日10時：GPT-4oは日本語におけるトークナイザーの最適化が施されていることを追記しました

ろぼいん

Twitter Misskey GitHub Qiita

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。