【動画生成AIの新時代】OpenAI「Sora 2」とGoogle「Veo 3.1」がもたらす未来とは？

AI・人工知能

ニュース

連載 [第50回] :

Gen AI Times

2025年10月30日(木)

池田大喜

本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介＆深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。

はじめに

本連載では、生成AIコミュニティ「IKIGAI lab.」に所属する各分野の専門家が、それぞれの視点から最新のAIトレンドとビジネスへの示唆を発信しています。本記事を通じて、皆さまが“半歩先の未来”に思いを馳せ、異なる価値観や視座に触れていただければ幸いです。

2024年は動画生成AIが一般に浸透した年でしたが、以下の2大課題が在りました。

課題1：人物・物体の一貫性維持の困難さ
最先端のモデル(Sora、Veoなど)でさえ、動画内で登場人物の髪型や服装、物体のテクスチャなどの細部をフレーム間で完全に維持することが難しく違和感のある動画になる。

課題2：物理法則の再現の不十分さ
生成された動画には、剛体物理や流体力学といった現実世界の基本的な法則を無視した描写が頻繁に見られた。例えば、物体が床にめり込む、液体が不自然な場所から出現する、といった破綻が発生する。

【参照】「生成AIの長時間コンテンツ生成における課題と解決策｜「数秒の壁」を突破する方法はあるのか」(アドバンスドテクノロジーX株式会社 2024/11/07)

そんな動画生成AIは2025年に大きく進化を遂げました。この進化競争を牽引しているのが、OpenAIとGoogleで最新モデルの「Sora 2」と「Veo3.1」を発表し、再注目されています。

本記事では、このAI動画生成の大きな変化を捉え、Sora 2とVeo3.1がもたらした具体的な革新により、2024年に比べてどのくらい進化したのかを紹介し、この技術進化に伴う社会的・倫理的な課題に触れていきたいと思います。

【参照】「Sora 2 vs Veo 3 vs Runway Gen‑3: 2025 AI Video Model Comparison Guide」(skywork ai 2025/10/02)

OpenAI：Sora 2

Sora 2は、2025年9月30日にOpenAIからリリースされた、同社の主力動画・音声生成モデルです。このモデルは、2024年2月に公開された初代Sora(動画生成におけるGPT-1に相当)から一気に進化したとされ、現在は動画生成におけるGPT-3.5に相当する段階に到達したと見なされています。

具体的なアップデート内容は以下になります。

物理法則への準拠と世界シミュレーションの向上
従来の動画生成モデルでは困難であった、複雑な物理法則の再現性が改善されました。これは、実用的な世界シミュレーターを構築する上で極めて重要な、成功だけでなく失敗も再現できる機能です。

強化された制御性と汎用的な音声生成機能
複数のシーンにまたがる複雑な指示に対応しながら、世界の状態を正確に維持できるなど、制御性が大きく進化しました。また、Sora 2は汎用的な動画・音声生成システムとして機能し、現実感のある洗練された環境音、音声、効果音を作成する能力を備えています。

iOS向けソーシャルアプリ「Sora」のリリースとカメオ機能
Sora 2を搭載したiOS向けソーシャルアプリ「Sora」が新たにリリースされました。このアプリの目玉機能は「カメオ機能」です。ユーザーが短い動画と音声を記録し本人確認と容姿の登録を済ませると、その人物の外見と音声を驚くほど忠実に再現し、Soraが生成したあらゆるシーンに直接追加できます。

現実世界の要素の直接取り込み機能
チームメイトの動画を与えることで、その人物の外見と音声を正確に再現し、Soraが生成した環境に挿入できるようになりました。この機能は汎用性が高く、人、動物、物体といったあらゆる現実世界の要素に利用できます。

ウェルビーイングと安全性への責任あるアプローチ
ユーザーのウェルビーイングを最優先とする設計理念に基づき、フィードの表示内容を制御する仕組みが提供されます。特に10代の若者の保護を重視しており、デフォルトで生成コンテンツの閲覧数制限や、より厳格なカメオ機能の権限設定が適用されます。

【参照】「Sora 2 が公開」(OpenAI 2025/09/30)

Google：Veo 3/3.1

Veo 3.1は、Veo 3を基に構築された最先端のモデルです。このアップデートにより、より豊かなオーディオ、高度な物語制御、そして真に迫るテクスチャを捉える強化されたリアリズムがもたらされます。
Veo 3.1は、Veo 3の上に構築された最先端のモデルであり、画像からの動画生成におけるプロンプト順守の強化と、視聴覚品質の改善を提供します。

具体的なアップデート内容は以下になります。