OpenAIが動画生成AI「Sora」を正式リリース 有料ユーザー向けに提供

サムネイル
画像:OpenAI

ChatGPTで知られるOpenAIが、テキストから動画を生成できるAI「Sora」を正式にリリースしました。

Soraは公式Webサイトから利用でき、AIが現実世界を理解し、シミュレーションする基盤として位置付けられています。

「Sora Turbo」の導入

Soraは、2024年2月にプレビュー版として紹介され、テキストからリアルな動画できることから注目を集めました。

こうした技術は、映画や広告、教育コンテンツなど、さまざまな分野での映像制作を効率化する可能性を秘めています。

今回の正式リリースでは、「Sora Turbo」と呼ばれる新バージョンが導入されており、以前のプレビュー版と比べて大幅に高速化されています。Sora Turboは、動画の品質や多様性にも改善が加えられているとのことです。

Sora Turboは、OpenAIの有料サブスクリプションサービスである「ChatGPT Plus」「ChatGPT Pro」のユーザーに向けて、独立した製品として提供されます。

ChatGPT Proは先日発表されたばかりの新しい料金プランで、ChatGPTにおいてより高度な推論能力をもつAI「OpenAI o1」を無制限で利用できるといった特徴があります。

ChatGPTの有料プランについては、こちらの記事を参照してください。

Soraの機能

SoraのUIは、ユーザーエクスペリエンス(UX)を重視しており、幅広いユーザーに対応しています。

各フレームの入力を正確に指定できるストーリーボードツールを使うことで、映像のディテールをコントロールできます。

Soraは、最大1080pで20秒までの動画を生成できます。ワイドスクリーン、縦型、正方形といったさまざまなアスペクト比に対応しており、用途に応じた最適な比率を選択できます。

他にも、自分で用意した素材(画像、音声、動画素材など)をアップロードすることで、生成された動画を拡張、リミックス、ブレンドできます。

また、コミュニティフィードも用意されており、「Featured」「Recent」フィードでは、コミュニティの他のユーザーの作品を参考にしたり、インスピレーションを得たりできます。

Soraは、映画制作、広告制作、教育コンテンツの作成など、幅広い分野での利用が期待されています。

Soraを使うには?

Soraを利用するには、ChatGPT PlusまたはChatGPT Proに加入している必要があります。

ChatGPT Plusでは、480p解像度の動画を毎月最大50本まで生成できます。

ChatGPT Proでは、480p解像度の動画を毎月最大500本生成でき、最大1080pや最大20秒の動画も生成できます。高解像度の動画では生成できる本数が減少する一方で、低速生成モードでは無制限の本数を生成できます。

Soraは日本を含むさまざまな国で利用できますが、ヨーロッパのほとんどの国とイギリスでは利用できません。

Soraの安全対策

OpenAIは、Soraの現行バージョンに多くの制約があることを認めています。非現実的な物理現象が生成されたり、長時間にわたる複雑な動作の一貫性の維持が困難である点が指摘されています。

一方で、Sora Turboは初版に比べて大幅に高速化され、技術の普及に向けた取り組みが進められています。

Soraには、C2PAやウォーターマークをはじめとした安全対策が実装されているとのことです。

Soraが生成したすべての動画には、出所を識別するC2PAメタデータが付与されており、透明性の確保と起源の検証が可能です。これにより、生成されたコンテンツがAIによるものであることを明示し、不正利用を防止します。

また、目に見えるウォーターマークがデフォルトで追加されるため、動画がAI生成であることを視覚的にも明示します。これにより、視聴者がコンテンツの信頼性を判断しやすくなります。

児童の性的虐待素材や性的なディープフェイクなど、とくに有害なコンテンツの生成をブロックする仕組みも導入されています。さらに、現時点では人物を含む素材のアップロードが制限されているとのことです。

まとめ

OpenAIが正式にリリースした動画生成AI「Sora」は、テキストからリアルな動画を生成できることから注目を集めています。

Sora Turboと呼ばれる新バージョンは、プレビュー版と比べて大幅に高速化され、動画の品質や多様性にも改善が加えられています。Soraは、ChatGPT PlusまたはChatGPT Proに加入しているユーザー向けに提供されています。

参考

#AI#OpenAI#Sora#ニュース
Xに共有する Blueskyに共有する Misskeyに共有する LINEに共有する Threadsに共有する
著者のアイコン画像

生まれた時から、母国語よりも先にJavaScriptを使っていました。ネットの海のどこにもいなくてどこにでもいます。

Webフロントエンドプログラマーで、テクノロジーに関する話題を追いかけています。動画編集やプログラミングが趣味で、たまにデザインなどもやっています。主にTypeScriptを使用したWebフロントエンド開発を専門とし、便利で実用的なブラウザー拡張機能を作成しています。また、個人ブログを通じて、IT関連のニュースやハウツー、技術的なプログラミング情報を発信しています。