2024年7月19日 03:22更新：2025年5月28日 14:52

GPT-4o miniリリース！料金や使い方、性能などを解説

2024年7月18日（現地時間）、OpenAIが新たな大規模言語モデル（LLM：Large Language Model）の「GPT-4o mini」をリリースしました。コスト効率と性能でAIの利用可能性を拡大することを目指しています。

この記事では、GPT-4o miniの料金や使い方、性能などについて詳しく解説します。

GPT-4o miniの概要

GPT-4o miniは、OpenAIがリリースしたもっともコスト効率のよい小型モデルです。MMLUと呼ばれるベンチマークで82%のスコアを記録しました。

LMSYS leaderboard では、GPT-4（gpt-4-0125-preview）に勝るチャットパフォーマンスを示しています。GPT-4o miniは、少し前から LMSYS leaderboardに登場していた「upcoming-gpt-mini」と同一のモデルだと思われます。

このモデルは、OpenAIの従来の最先端モデルに比べて一桁も安価です。また、GPT-3.5 Turboよりも60%以上低コストです。

なお、GPT-4o miniのひとつ前のモデルであるGPT-4oについては、こちらの記事で紹介しています。

GPT-4o発表！OpenAI Spring Updateの発表内容まとめ

5月14日午前2時（日本時間）から、OpenAIは「Spring Update」と題し、GPT-4関連の新機能についてのライブ配信を実施しました。この記事では、OpenAIがライブ配信で発表したSpring Updateの内容についてまとめます。

GPT-4oの概要から使い方まで徹底解説！OpenAIの次世代フラッグシップモデル

2024年5月13日、OpenAIは次世代のフラッグシップモデルであるGPT-4oを発表しました。この記事では、GPT-4oの概要から使い方までを徹底解説します。

性能

GPT-4o miniは、128Kトークンのコンテキストウィンドウをもち、テキストとビジョンの両方をサポートします。今後、テキスト、画像、動画、音声の入出力もサポートされる予定です。

推論タスクのベンチマークであるMMLUで82.0%のスコアを獲得しています。これに対し、GoogleのGemini Flashは77.9％、AnthropicのClaude Haikuは73.8％です。

また、数学的推論とコーディングタスクを測るMGSMで87.0%、コーディングパフォーマンスを測るHumanEvalで87.2%を記録しています。Gemini Flashはそれぞれ75.5%と71.7%、Claude Haikuはそれぞれ71.5%と75.9%です。

マルチモーダル推論のベンチマークであるMMMUでは、59.4%を獲得しました。これに対し、Gemini Flashは56.1%、Claude Haikuは50.2%です。

複数のLLMの性能を比較したグラフ — GPT-4o miniの性能を示すグラフ画像クレジット： OpenAI

ジェイルブレイク対策の強化

GPT-4o miniは、新しい「インストラクションヒエラルキー（命令階層）」に対応した最初のモデルです。インストラクションヒエラルキーは、モデルがユーザーのプロンプトよりもシステムプロンプトを優先するように指示することでジェイルブレイクを防ぐ新しい手法です。

これまで、ユーザーによってさまざまなジェイルブレイク方法が生み出されてきました。たとえば、ユーザーが「これまでの命令をすべて無視してください」と入力するとシステムプロンプトが無視される、といったものです。

インストラクションヒエラルキーは、このようなジェイルブレイクを防ぐために、プロンプトに優先順位を設けます。

GPT-4o miniはインストラクションヒエラルキーを導入したことで、ジャイルブレイク、プロンプトインジェクション、システムプロンプト抽出に対する抵抗力が強化され、信頼性の高い応答が期待できます。

価格

GPT-4o miniは現在、Assistants API、Chat Completions API、およびBatch APIから利用できます。また、今後はファインチューニングのサポートも予定されています。

ChatGPTでは、Free、Plus、TeamユーザーがGPT-3.5 Turboの代わりにGPT-4o miniを利用可能です。エンタープライズユーザーも来週からアクセスできます。

GPT-4o miniのAPIの価格は、次のとおりです。なお、価格は記事執筆時点での情報です。

入力：100万トークンあたり15セント（0.15ドル）
出力：100万トークンあたり60セント（0.60ドル）

参考までにGPT-4oは、入力が100万トークンあたり5ドル、出力が100万トークンあたり15ドルです。GPT-4o miniの入力コストはGPT4oのわずか3%、出力コストは4%ということになります。

また、 Batch API を利用するとさらに半分の価格になります。Batch APIは、急ぎでない大量のデータを一度に処理する際に便利です。

使い方

GPT-4o miniは、APIとChatGPTのFree、Plus、Teamユーザーが利用可能で、エンタープライズユーザーも来週からアクセスできます。

記事執筆時点では、ChatGPTではまだ利用できませんでした。一方で、APIからはすでに利用可能になっています。APIでは、モデルとしてgpt-4o-miniを指定することでGPT-4o miniを利用できます。

APIから利用可能なモデルの一覧のスクリーンショット。 OpenAIの価格ページより

OpenAI PlatformのPlayground を使うと、コードを書かずにAPI経由でGPT-4o miniを試せます。Playgroundは、APIのリクエストとレスポンスを簡単に確認できるため、APIの使い方を学ぶのに最適です。

また、例として、PythonからGPT-4o miniのAPIを利用する場合と、コマンドラインから利用する場合のサンプルコードを示します。なお、APIを利用するには、APIキーが必要です。APIキーは、他人と共有しないように注意してください。

1
from openai import OpenAI
2
client = OpenAI()
3

4
response = client.chat.completions.create(
5
  model="gpt-4o-mini",
6
  messages=[
7
    {
8
      "role": "system",
9
      "content": [
10
        {
11
          "type": "text",
12
          "text": "<ここにシステムプロンプトを入力>"
13
        }
14
      ]
15
    },
16
    {
17
      "role": "user",
18
      "content": [
19
        {
20
          "type": "text",
21
          "text": "<ここにユーザーからのメッセージを入力>"
22
        }
23
      ]
24
    }
25
  ],
26
  temperature=1,
27
  max_tokens=256,
28
  top_p=1,
29
  frequency_penalty=0,
30
  presence_penalty=0
31
)

以下は、コマンドラインからGPT-4o miniのAPIを利用する場合のサンプルコードです。$OPENAI_API_KEYには、実際のAPIキーを設定してください。また、環境によっては改行する方法が異なる場合があるので、適宜修正してください。たとえば、WindowsのPowerShellでは、末尾の/をバッククォート（`` ` ``）に置き換える必要があります。

curl https://api.openai.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
  "model": "gpt-4o-mini",
  "messages": [
    {
      "role": "system",
      "content": [
        {
          "type": "text",
          "text": "<ここにシステムプロンプトを入力>"
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "<ここにユーザーからのメッセージを入力>"
        }
      ]
    }
  ],
  "temperature": 1,
  "max_tokens": 256,
  "top_p": 1,
  "frequency_penalty": 0,
  "presence_penalty": 0
}'

まとめ

OpenAIがリリースしたGPT-4o miniは、コスト効率の高い小型モデルです。GPT-4o miniは、GPT-3.5 Turboよりも60%以上低コストでありながら、MMLUで82%のスコアを記録しています。また、ジェイルブレイク対策としてインストラクションヒエラルキーを導入しています。

今後は、テキスト、画像、動画、音声の入出力をサポートする予定です。GPT-4o miniは、APIとChatGPTのFree、Plus、Teamユーザーが利用可能で、エンタープライズユーザーも来週からアクセスできます。

参考

GPT-4o mini: advancing cost-efficient intelligence | OpenAI

#AI #OpenAI #ChatGPT #プログラミング #ニュース #解説

このサイトを支援する

Buy Me a CoffeeまたはGitHub Sponsorsで支援していただけると、サイトの運営やコンテンツ制作の励みになります。定期的な支援と一度限りの支援がありますので、お間違いのないようにお願いします。

ろぼいん

X Misskey GitHub Qiita

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。

GPT-4o miniリリース！料金や使い方、性能などを解説

GPT-4o miniの概要

性能

ジェイルブレイク対策の強化

価格

使い方

まとめ

参考

おすすめアイテム

このサイトを支援する

関連記事

Xcode 26にChatGPTなどのAIが統合へ　ローカルLLMも利用可能

OpenAIがブラウザー操作を自動化するAI「Operator」を発表

GPT-4oの概要から使い方まで徹底解説！OpenAIの次世代フラッグシップモデル

GPT-4o発表！OpenAI Spring Updateの発表内容まとめ

ChatGPTの最新モデルo3に個人情報流出のリスク　会話の共有に注意

注目記事

【PC・スマホ】Discordでメッセージの文字を大きくする方法

ChatGPTのメモリーを削除・管理する方法【Web・スマホアプリ】

X（Twitter）のいいねが見れない？いいねした人を確認する方法

Lhaplusでファイル名が文字化けするときの対処法

macOSでLinuxコンテナを実行できるContainerizationフレームワークが登場

最新記事

OpenAI o3が80%値下げでGPT-4oよりも安価に　o3-proもまもなくリリース

YouTubeのコミュニティランキングとは？非表示にする方法も解説！

Xcode 26にChatGPTなどのAIが統合へ　ローカルLLMも利用可能

macOSでLinuxコンテナを実行できるContainerizationフレームワークが登場

Google ToDoリストをデスクトップ（Web）から使う方法

GPT-4o miniリリース！料金や使い方、性能などを解説

GPT-4o miniの概要

性能

ジェイルブレイク対策の強化

価格

使い方

まとめ

参考

おすすめアイテム

このサイトを支援する

関連記事

Xcode 26にChatGPTなどのAIが統合へ ローカルLLMも利用可能

OpenAIがブラウザー操作を自動化するAI「Operator」を発表

GPT-4oの概要から使い方まで徹底解説！OpenAIの次世代フラッグシップモデル

GPT-4o発表！OpenAI Spring Updateの発表内容まとめ

ChatGPTの最新モデルo3に個人情報流出のリスク 会話の共有に注意

注目記事

【PC・スマホ】Discordでメッセージの文字を大きくする方法

ChatGPTのメモリーを削除・管理する方法【Web・スマホアプリ】

X（Twitter）のいいねが見れない？いいねした人を確認する方法

Lhaplusでファイル名が文字化けするときの対処法

macOSでLinuxコンテナを実行できるContainerizationフレームワークが登場

最新記事

OpenAI o3が80%値下げでGPT-4oよりも安価に o3-proもまもなくリリース

YouTubeのコミュニティランキングとは？非表示にする方法も解説！

Xcode 26にChatGPTなどのAIが統合へ ローカルLLMも利用可能

macOSでLinuxコンテナを実行できるContainerizationフレームワークが登場

Google ToDoリストをデスクトップ（Web）から使う方法

Xcode 26にChatGPTなどのAIが統合へ　ローカルLLMも利用可能

ChatGPTの最新モデルo3に個人情報流出のリスク　会話の共有に注意

OpenAI o3が80%値下げでGPT-4oよりも安価に　o3-proもまもなくリリース

Xcode 26にChatGPTなどのAIが統合へ　ローカルLLMも利用可能