Claude 3.5 Sonnetリリース!性能や価格、使い方からGPT-4oとの比較まで徹底解説

#AI#Anthropic#Claude#ニュース#解説
投稿日: 更新日:
サムネイル

6月21日、Anthropicから最新モデルClaude 3.5 Sonnetが発表されました。前世代モデルのClaude 3 Opusをはるかに超える性能をもっています。

この記事では、Claude 3.5 Sonnetの特徴や使い方、価格設定、さらにGPT-4oとの比較まで詳しく解説します。

Claude 3.5 Sonnetの概要&GPT-4oとの比較

Claude 3.5 Sonnetは、大学院レベルの推論(GPQA)、学部レベルの知識(MMLU)、コーディング熟練度(HumanEval)などのベンチマークで好成績を収めています。

さらに、ユーモアやニュアンスの理解複雑な指示の解釈においても性能の向上を果たしています。さらに、自然な口調で高品質なコンテンツを生成する能力が強化されました。

Claude 3.5 Sonnetは、前世代のフラッグシップモデル「Claude 3 Opus」の2倍の速度で動作し、コストパフォーマンスも高くなっています。また、価格は前世代のミドルレンジのClaude 3 Sonnetと同じに設定されています。

Claudeファミリーの価格の比較画像
画像:Anthropic

自然言語による改善指示をもとに、オープンソースのコードベースに対するバグ修正や機能追加をする内部エージェントコーディング評価では、Claude 3.5 Sonnetは64%の問題を解決しました。

これは、38%しか解決できなかったClaude 3 Opusを大きく上回る結果です。

Anthropicが公開したベンチマークでは、MMLU(学部レベルの知識)やMATH(数学問題解決)などのタスクを除いて、Claude 3.5 Sonnetが他のモデルを上回る結果を示しています。

複数のLLMの複数のベンチマークにおける結果の表
画像:Anthropic

このベンチマーク結果によると、Claude 3.5 Sonnetは全体的に、OpenAIのフラッグシップモデルのGPT-4oや、GoogleのGemini 1.5 Pro、MetaのLlama-400bなどの他のモデルよりも高い性能を示しています。

記事のサムネイル
Google Gemini 1.5リリース!コンテキストウィンドウ拡大と高効率アーキテクチャで性能が大幅に向上
Googleがマルチモーダルな大規模言語モデル(LLM)のGemini 1.5をリリースしました。今回のリリースは、先日のGemini Advancedの公開に続くものです。また、AI StudioおよびVertex AIのGemini APIを通して1.0 Ultraを利用できるようになりました。この記事では、Googleの次世代モデルである「Gemini 1.5」について深堀りします。

さらに、視覚的な情報に関するベンチマークでも、Claude 3.5 Sonnetは良好な成績を収めています。

視覚関連のベンチマーク結果の表
画像:Anthropic

価格設定

Claude 3.5 Sonnetの料金は、入力は100万トークンあたり3ドル出力は100万トークンあたり15ドルとなっており、200Kトークンのコンテキストウィンドウが利用可能です。

OpenAIのフラッグシップモデルであるGPT-4oは、入力が100万トークンあたり5ドル、出力が100万トークンあたり15ドルで、128Kトークンのコンテキストウィンドウが利用可能です。

つまり、Claude 3.5 SonnetはGPT-4oと比較して、より長いコンテキストウィンドウが利用でき、入力の価格が(スペックシート上では)安いという特徴があります。

ただし、GPT-4oは日本語におけるトークナイザーの最適化が施されており、消費するトークン数が削減されているため、実際に日本語で利用した場合にどちらが安いかは不明です。

Artifacts機能

新たに導入されたArtifacts機能により、コードスニペットやドキュメント、Webデザインなどの生成物を、専用ウィンドウでリアルタイムに確認、編集、構築できるようになります。

この機能は、プロジェクトやワークフローにAI生成コンテンツを利用する際に、より効率的な作業環境を提供します。

使い方

Claude 3.5 Sonnetは、無料でClaude.aiとClaude iOSアプリで利用可能です。記事執筆時点では、Claudeのチャットを利用した際にデフォルトでClaude 3.5 Sonnetが選択されるようになっていました。

また、Claude ProやTeamプランに加入している場合は、より高いレート制限で利用できます。

さらに、Anthropic APIAmazon BedrockGoogle Cloud Vertex AIからも利用できます。

まとめ

Claude 3.5 Sonnetは、前モデルのClaude 3 Opusを大きく上回る性能を持ち、GPT-4oなどの他のモデルと比較しても高い性能を示しています。

価格設定もGPT-4oと比較して入力が安く、より長いコンテキストウィンドウが利用できるため、コストパフォーマンスに優れています。

Claude 3.5 Sonnetは、自然言語処理や視覚的な情報処理において、高品質なコンテンツ生成や問題解決を行うための強力なツールとして期待されています。

Anthropicの今後の展開にも注目です。

参考

更新履歴

Twitterのアイコン LINEのアイコン Threadsのアイコン Misskeyのアイコン Misskeyのアイコン
著者のアイコン画像

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。