Googleの動画生成AI「Veo」が登場 Google I/O 2024で発表
Googleが最新の動画生成モデル「Veo」を発表しました。Veoは、高品質な1080p解像度の動画を生成できます。この記事では、Veoの特徴や映像制作への影響、実際の活用例について詳しく見ていきます。
VeoはGoogleの開発者向けイベント「Google I/O 2024」で発表されました。Google I/Oで発表された他の新機能やアップデートについては、こちらの記事を参照してください。
Veoとは?
Veoは、テキストプロンプトから正確にニュアンスやトーンを捉える動画生成AIです。たとえば、タイムラプスや風景の空撮など、さまざまなシネマティックエフェクトを理解し、それに対応したビデオを生成できます。また、複雑なシーンの中で微細なディテールを描写することにも優れています。
類似の技術には、OpenAIが開発した「Sora」があります。Veoが発表されたGoogle I/O 2024の前日には、OpenAIの新しい言語モデル「GPT-4o」が発表されています。
Veoができること
Veoは、入力とする動画に編集コマンドを与えることで、新しい動画を生成できます。たとえば、海岸線の空撮ビデオにカヤックを追加するような編集も可能です。また、マスク編集機能を利用することで、特定のエリアのみを変更することもできます。さらに、画像を入力として使用し、テキストプロンプトと組み合わせて動画を生成することもできます。
Veoは、教育者にとっても非常に有用です。教育目的のビデオを簡単に制作でき、よりインタラクティブで魅力的な教材を作成する手助けになります。また、ストーリーテリングの手段としても活用でき、クリエイターが自分のアイデアを具体的な映像作品として表現しやすくなります。
Veoの仕組み
Veoは、高度な言語理解と視覚的セマンティクスにもとづいて開発されています。これにより、テキストプロンプトと視覚的な情報を正確に解釈し、統一感のあるシーンを生成できます。また、Veoは潜在拡散トランスフォーマー(Latent Diffusion Transformers)を用いて、フレーム間の一貫性を維持し、視覚的連続性を高めています。
Googleは、Generative Query Network(GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet、LumiereなどにもとづいてVeoを構築したとのことです。これらの技術により、Veoはより効率的かつ高品質なビデオを生成できます。
またVeoは、AI生成コンテンツ向けの電子透かし技術の「SynthID」や安全フィルター、プライバシー・著作権リスクの軽減策を導入しています。
Veoを使う方法
Googleは、今後数週間以内に新しい実験ツール「VideoFX」を通じて、Veoの一部の機能をクローズドベータで提供すると発表しています。アメリカに拠点を置く18歳以上のユーザーは、こちらからウェイティングリストに登録できます。
Googleは今後、Veoの機能をYouTube Shortsなど他のGoogle製品にも組み込む予定としています。これにより、より多くのユーザーのクリエイティブな活動を支援することが期待されます。
まとめ
Googleの動画生成AI「Veo」は、高品質なビデオを生成できる新しいツールです。Veoは、テキストプロンプトから正確なニュアンスやトーンを捉え、さまざまなシネマティックエフェクトを理解し、それに対応したビデオを生成できます。教育やクリエイターの活動を支援するため、GoogleはVeoの機能を他の製品にも組み込む予定です。