2024年9月13日 02:29更新：2024年9月14日 01:29

OpenAIが複雑な問題解決に特化したモデル「OpenAI o1」を発表！料金や使い方、プロンプトのコツまで解説

2024年9月12日（現地時間）、OpenAIは、複雑な問題の解決に特化した新しいAIモデルシリーズ「OpenAI o1」を発表しました。このモデルは、科学、コーディング、数学などの分野で、従来のモデルよりも優れた性能を発揮するとのことです。

この記事では、OpenAI o1の特徴や料金、使い方について詳しく解説します。

OpenAI o1とは？

OpenAI o1は、応答する前に人間のように問題について時間をかけて考えるように設計されたAIモデルシリーズです。「Strawberry」というコードネームで開発されていました。

従来のモデルと比べ、より深く思考し、さまざまなな戦略を試行錯誤することで複雑な難しい問題にも対応できるのが特徴です。

なお、同日にGoogleはAIが誤った情報を生成する「幻覚（ハルシネーション）」を低減する「DataGemma」をリリースしています。

GoogleがAIの幻覚を軽減する「DataGemma」を公開

Googleは、LLMの幻覚問題に対処する新たな言語モデル「DataGemma」を発表しました。DataGemmaは、Googleのもつ膨大な実世界のデータを活用することで、LLMの信頼性向上を目指しています。

GPT-4との違い

OpenAI o1は、とくに複雑な推論タスクにおいてGPT-4oを凌駕する性能をもっています。

国際数学オリンピック(IMO)の予選問題において、GPT-4の正答率は13%でしたが、o1は83%と大幅に上回る結果をたたき出しました。コーディングにおいては、Codeforcesコンテストで89パーセンタイルに達するなど、高い能力を示しています。

GPT-4oは、幅広い知識と自然な文章生成能力で注目を集めましたが、複雑な推論タスクでは限界がありました。OpenAI o1はその限界を突破し、より高度な問題解決能力を実現しています。

GPT-4oの概要から使い方まで徹底解説！OpenAIの次世代フラッグシップモデル

2024年5月13日、OpenAIは次世代のフラッグシップモデルであるGPT-4oを発表しました。この記事では、GPT-4oの概要から使い方までを徹底解説します。

GPT-4o発表！OpenAI Spring Updateの発表内容まとめ

5月14日午前2時（日本時間）から、OpenAIは「Spring Update」と題し、GPT-4関連の新機能についてのライブ配信を実施しました。この記事では、OpenAIがライブ配信で発表したSpring Updateの内容についてまとめます。

OpenAI o1の特徴

OpenAI o1には、次のような特徴があります。

高度な推論能力

OpenAI o1は、物理学、化学、生物学などの分野で、博士課程の学生と同等の性能を発揮する推論能力を備えています。これは、モデルが問題を多角的に分析し、論理的な思考に基づいて解答を導き出せることを意味します。

OpenAI o1は、複雑な科学論文を理解し、研究の進捗に貢献する可能性を秘めているといえます。物理学者が複雑な数式を作成したり、開発者が複数ステップにおよぶワークフローを構築したりする際にも利用できます。

強化された安全性

OpenAIは、OpenAI o1の開発において安全性も強化していると述べています。

OpenAI o1はその推論能力を活用して、安全ガイドラインを理解し、従うようにトレーニングされているとのことです。

また、「脱獄（ジェイルブレイク）」と呼ばれる、ユーザーが安全対策を回避しようとする試みに対しても、GPT-4oよりも高い耐性を示しています。OpenAIによるジェイルブレイクのテストでは、GPT-4oは100点中22点でしたが、o1-previewは84点でした。

OpenAI o1-mini

OpenAIは、開発者向けに、o1-previewよりも高速かつ安価な推論モデル「OpenAI o1-mini」もリリースしました。o1-miniは、o1-previewと比較して、80%のコスト削減を実現しています。

o1-miniは、とくにコーディングに特化しており、複雑なコードの生成やデバッグに効果的です。

OpenAI o1の料金

OpenAI o1のAPIの料金は、記事執筆時点では次のとおりです。

o1-preview：入力は100万トークンあたり15ドル、出力は100万トークンあたり60ドル
o1-mini：入力は100万トークンあたり3ドル、出力は100万トークンあたり12ドル

参考までに、GPT-4oとGPT-4o miniの料金を掲載します。

gpt-4o：入力は100万トークンあたり5ドル、出力は100万トークンあたり15ドル
gpt-4o-2024-08-06：入力は100万トークンあたり2.5ドル、出力は100万トークンあたり10ドル
gpt-4o-mini：入力は100万トークンあたり0.15ドル、出力は100万トークンあたり0.60ドル

OpenAI o1の使い方

OpenAI o1は、ChatGPTの有料プランまたはAPIを通じて利用できます。各プランでの利用方法は次のとおりです。

ChatGPT

ChatGPT PlusとChatGPT Teamのユーザーは、今日からChatGPT内でo1モデルを利用できます。o1-previewとo1-miniは、モデル選択機能で手動で選択できます。

現時点では、o1-previewは週30メッセージ、o1-miniは週50メッセージの利用制限があります。

OpenAIは、これらの制限を緩和し、ChatGPTが自動的に適切なモデルを選択できるように取り組んでいると述べています。

また、ChatGPT EnterpriseとChatGPT Eduのユーザーは来週からo1モデルを利用できるようになるとのことです。

API

開発者向けのAPIについては、ティア5の開発者のみがo1モデルを利用できます。

API経由での利用には、1分間に20リクエストの制限があります。OpenAIは、テストを重ね、制限を緩和していく予定とのことです。

プロンプトのコツ

OpenAI o1の性能を最大限に引き出すためには、これまでとは少し違ったプロンプトの書き方が必要です。ここでは、OpenAI o1の性能をアップさせるプロンプトのコツをいくつか紹介します。

プロンプトをシンプルにする

OpenAI o1のプロンプトはシンプルにすることが推奨されています。

これまでは、プロンプトの中で応答の例を示したり、モデルに対してステップバイステップで考えるように指示したりといった手法が知られていました。

しかしOpenAI o1では、こういった手法はあまり効果がなかったり、逆にパフォーマンスの悪化を招く場合があります。

OpenAI o1のプロンプトにはシンプルで明確な指示を書きましょう。

ステップバイステップで考えるように指示しない

前述のように、OpenAI o1のプロンプトはシンプルにすることが推奨されています。また、OpenAI o1は内部で連鎖的に思考するように設計されています。

そのため、ステップバイステップで段階的に思考するように指示する必要はありません。指示をシンプルにすることで、モデルが自由に思考できるようになります。

区切り文字を使う

三重引用符やXMLタグ、セクションタイトルなどの区切り文字を使って、プロンプトのセクションを構造化することで、モデルが指示を理解しやすくなります。

XMLタグは、たとえば次のように使います。

try{(()=>{function a(e){if(!e)return;let t=e.getAttribute("tabindex")!==null,n=e.scrollWidth>e.clientWidth;n&&!t?e.setAttribute("tabindex","0"):!n&&t&&e.removeAttribute("tabindex")}var u=window.requestIdleCallback||(e=>setTimeout(e,1)),i=window.cancelIdleCallback||clearTimeout;function l(e){let t=new Set,n,r;return new ResizeObserver(c=>{c.forEach(o=>t.add(o.target)),n&&clearTimeout(n),r&&i(r),n=setTimeout(()=>{r&&i(r),r=u(()=>{t.forEach(o=>e(o)),t.clear()})},250)})}function d(e,t){e.querySelectorAll?.(".expressive-code pre > code").forEach(n=>{let r=n.parentElement;r&&t.observe(r)})}var s=l(a);d(document,s);var b=new MutationObserver(e=>e.forEach(t=>t.addedNodes.forEach(n=>{d(n,s)})));b.observe(document.body,{childList:!0,subtree:!0});document.addEventListener("astro:page-load",()=>{d(document,s)});})();}catch(e){console.error("[EC] tabindex-js-module failed:",e)}

try{(()=>{function i(o){let e=document.createElement("pre");Object.assign(e.style,{opacity:"0",pointerEvents:"none",position:"absolute",overflow:"hidden",left:"0",top:"0",width:"20px",height:"20px",webkitUserSelect:"auto",userSelect:"all"}),e.ariaHidden="true",e.textContent=o,document.body.appendChild(e);let a=document.createRange();a.selectNode(e);let n=getSelection();if(!n)return!1;n.removeAllRanges(),n.addRange(a);let r=!1;try{r=document.execCommand("copy")}finally{n.removeAllRanges(),document.body.removeChild(e)}return r}async function l(o){let e=o.currentTarget,a=e.dataset,n=!1,r=a.code.replace(/\u007f/g,` `);try{await navigator.clipboard.writeText(r),n=!0}catch{n=i(r)}if(!n||e.parentNode?.querySelector(".feedback"))return;let t=document.createElement("div");t.classList.add("feedback"),t.append(a.copied),e.before(t),t.offsetWidth,requestAnimationFrame(()=>t?.classList.add("show"));let c=()=>!t||t.classList.remove("show"),d=()=>{!t||parseFloat(getComputedStyle(t).opacity)>0||(t.remove(),t=void 0)};setTimeout(c,1500),setTimeout(d,2500),e.addEventListener("blur",c),t.addEventListener("transitioncancel",d),t.addEventListener("transitionend",d)}function s(o){o.querySelectorAll?.(".expressive-code .copy button").forEach(e=>e.addEventListener("click",l))}s(document);var u=new MutationObserver(o=>o.forEach(e=>e.addedNodes.forEach(a=>{s(a)})));u.observe(document.body,{childList:!0,subtree:!0});document.addEventListener("astro:page-load",()=>{s(document)});})();}catch(e){console.error("[EC] copy-js-module failed:",e)}

1
<question>次の問題を解いてください。</question>
2
<problem>1+1=?</problem>

また、セクションタイトルは、Markdown形式の見出しを使います。#の数が多いほど、より深い（下位の）セクションとして認識されます。

1
# 指示
2

3
次の問題を解いてください。
4

5
## 問題
6

7
1+1=?

必要な情報のみを与える

検索拡張生成（RAG）などを使って、モデルに対して追加のコンテキスト（文脈情報）を与える場合は、もっとも関連性の高いもののみを与えるようにしましょう。

前述のように、OpenAI o1はシンプルなプロンプトを使うことが推奨されています。

コンテキストを与えすぎると、モデルが混乱する可能性があるため、必要な情報のみを与えるようにしましょう。

まとめ

OpenAIは、複雑な問題の解決に特化した新しいAIモデルシリーズ「OpenAI o1」を発表しました。o1は、高度な推論能力を備え、GPT-4oを凌駕する性能を持っています。

o1は、科学、コーディング、数学などの分野で、従来のモデルよりも優れた性能を発揮します。また、o1-miniという高速かつ安価なモデルもリリースされています。

参考

#OpenAI #AI #ニュース #解説

このサイトを支援する

Buy Me a CoffeeまたはGitHub Sponsorsで支援していただけると、サイトの運営やコンテンツ制作の励みになります。定期的な支援と一度限りの支援がありますので、お間違いのないようにお願いします。

ろぼいん

X Misskey GitHub Qiita

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。