【動画生成AIの新時代】OpenAI「Sora 2」とGoogle「Veo 3.1」がもたらす未来とは?

はじめに
本連載では、生成AIコミュニティ「IKIGAI lab.」に所属する各分野の専門家が、それぞれの視点から最新のAIトレンドとビジネスへの示唆を発信しています。本記事を通じて、皆さまが“半歩先の未来”に思いを馳せ、異なる価値観や視座に触れていただければ幸いです。
2024年は動画生成AIが一般に浸透した年でしたが、以下の2大課題が在りました。
課題1: 人物・物体の一貫性維持の困難さ
最先端のモデル(Sora、Veoなど)でさえ、動画内で登場人物の髪型や服装、物体のテクスチャなどの細部をフレーム間で完全に維持することが難しく違和感のある動画になる。
課題2: 物理法則の再現の不十分さ
生成された動画には、剛体物理や流体力学といった現実世界の基本的な法則を無視した描写が頻繁に見られた。例えば、物体が床にめり込む、液体が不自然な場所から出現する、といった破綻が発生する。
【参照】「生成AIの長時間コンテンツ生成における課題と解決策|「数秒の壁」を突破する方法はあるのか」(アドバンスドテクノロジーX株式会社 2024/11/07)
そんな動画生成AIは2025年に大きく進化を遂げました。この進化競争を牽引しているのが、OpenAIとGoogleで最新モデルの「Sora 2」と「Veo3.1」を発表し、再注目されています。
本記事では、このAI動画生成の大きな変化を捉え、Sora 2とVeo3.1がもたらした具体的な革新により、2024年に比べてどのくらい進化したのかを紹介し、この技術進化に伴う社会的・倫理的な課題に触れていきたいと思います。
【参照】「Sora 2 vs Veo 3 vs Runway Gen‑3: 2025 AI Video Model Comparison Guide」(skywork ai 2025/10/02)
OpenAI:Sora 2
Sora 2は、2025年9月30日にOpenAIからリリースされた、同社の主力動画・音声生成モデルです。このモデルは、2024年2月に公開された初代Sora(動画生成におけるGPT-1に相当)から一気に進化したとされ、現在は動画生成におけるGPT-3.5に相当する段階に到達したと見なされています。
具体的なアップデート内容は以下になります。
- 物理法則への準拠と世界シミュレーションの向上
従来の動画生成モデルでは困難であった、複雑な物理法則の再現性が改善されました。これは、実用的な世界シミュレーターを構築する上で極めて重要な、成功だけでなく失敗も再現できる機能です。 - 強化された制御性と汎用的な音声生成機能
複数のシーンにまたがる複雑な指示に対応しながら、世界の状態を正確に維持できるなど、制御性が大きく進化しました。また、Sora 2は汎用的な動画・音声生成システムとして機能し、現実感のある洗練された環境音、音声、効果音を作成する能力を備えています。 - iOS向けソーシャルアプリ「Sora」のリリースとカメオ機能
Sora 2を搭載したiOS向けソーシャルアプリ「Sora」が新たにリリースされました。このアプリの目玉機能は「カメオ機能」です。ユーザーが短い動画と音声を記録し本人確認と容姿の登録を済ませると、その人物の外見と音声を驚くほど忠実に再現し、Soraが生成したあらゆるシーンに直接追加できます。 - 現実世界の要素の直接取り込み機能
チームメイトの動画を与えることで、その人物の外見と音声を正確に再現し、Soraが生成した環境に挿入できるようになりました。この機能は汎用性が高く、人、動物、物体といったあらゆる現実世界の要素に利用できます。 - ウェルビーイングと安全性への責任あるアプローチ
ユーザーのウェルビーイングを最優先とする設計理念に基づき、フィードの表示内容を制御する仕組みが提供されます。特に10代の若者の保護を重視しており、デフォルトで生成コンテンツの閲覧数制限や、より厳格なカメオ機能の権限設定が適用されます。
【参照】「Sora 2 が公開」(OpenAI 2025/09/30)
Google:Veo 3/3.1
Veo 3.1は、Veo 3を基に構築された最先端のモデルです。このアップデートにより、より豊かなオーディオ、高度な物語制御、そして真に迫るテクスチャを捉える強化されたリアリズムがもたらされます。
Veo 3.1は、Veo 3の上に構築された最先端のモデルであり、画像からの動画生成におけるプロンプト順守の強化と、視聴覚品質の改善を提供します。
具体的なアップデート内容は以下になります。
-
Flowにおけるオーディオサポートの拡張:
Googleの動画生成AIツール Flowの全機能においてオーディオサポートを強化した。また、「Ingredients to Video」「Frames to Video」「Extend」などの既存機能に初めてオーディオが導入されました。 - シームレスなオブジェクト除去機能(近日公開):
不要なオブジェクトやキャラクターをシーンからシームレスに取り除く機能が導入されます。Flowが背景と周囲を再構築し、その物体が最初からなかったように見せます。 - 精密な編集と拡張:
「Ingredients to Video」で複数の参照画像を使ってキャラクターやスタイルを制御できます。また、「Extend」機能により、アクションを継続し、1分以上に及ぶ長いシームレスなショットを作成できます。 - Veo 3.1の利用拡大:
Veo 3.1モデルは、Flowでの利用に加え、開発者向けのGemini APIおよびエンタープライズ顧客向けのVertex AIからも利用可能です。
(参照:新しいVeo 3.1アップデートをFlowに導入し、AI動画を編集)
【参照】「新しいVeo 3.1アップデートをFlowに導入し、AI動画を編集」(Google 2025/10/15)
検証!Sora 2/ Veo 3.1で2024年の課題はどこまで解決した??
これまでの進化と各プレイヤーの強みを見てきましたが、実際にSora 2とGoogle Veo 3.1で冒頭で紹介した課題に対してどう変化したのか、確認していきます!
課題1: 人物・物体の一貫性維持の困難さ
今回は筆者の地元である「静岡県観光のVlog」をテーマに検証しました。両社とも、人物・物体の破綻が少なく、一貫していました。ただ、日本語を話す動画を生成する場合はSora 2の方が得意なことが分かりました。
Sora 2
Veo3.1
課題2:物理法則の再現の不十分さ
今回は「バスケのシュートを外す動画生成対決」をテーマに検証しました。結果、Veo3.1ではボールが明らかにネットをすり抜けている動画が出ました。Sora 2でも少し違和感はありますが、Veo3.1と比較すると、物理法則を再現して生成することができました。
Sora 2
(動画:筆者が Sora 2で作成)
Veo3.1
(動画:筆者がVeo3.1でVeo3.1‗basketball.mp4作成)
AI動画制作がもたらす社会的・倫理的な課題
AI動画生成の進化は、コンテンツ制作の民主化を加速させる一方で、ディープフェイクといった深刻な倫理的・法的課題も同時に顕在化させています。
著作権侵害と日本のコンテンツ保護
2025年10月1日にリリースされたOpenAIの動画生成AI「Sora 2」が、『呪術廻戦』やマリオなどの著作権で保護された日本のアニメ・ゲームコンテンツを含む動画を大量に生成し問題となりました。
これに対し、日本政府は日本の知的財産を「かけがえのない宝」と呼び、OpenAI社に対し、著作権侵害となるような行為を行わないよう、正式に要請したことが海外で話題になっています。内閣府の城内実特命担当大臣は、知的財産戦略推進事務局から直接要請を行ったことを明らかにしました。
OpenAIのサム・アルトマンCEOは、日本のコンテンツに言及し、状況の改善と権利者への収益分配を示唆しています。海外のIT系ニュースサイトやオンライン掲示板でも、この件は広く報じられています。
(参照:Sora and Veo: The Future of AI Video Generation and Marketing - NotebookLM)
【参照】「平大臣記者会見(令和7年10月7日)」(Youtube 2025/10/07)
まとめ
2025年にかけて、OpenAIの「Sora」やGoogleの「Veo」をはじめとする動画生成AIは、目覚ましい進化を遂げました。「Sora 2はGPT-3.5のレベルだ」と紹介されたように、この技術革新のスピードは今後さらに加速し、近い将来で誰もが映像クリエイターになれる可能性があります。
しかし、その裏では著作権侵害といった倫理的な課題が、すでに現実のものとして浮上しています。だからこそ今、技術を開発する側だけでなく、私たち「使う側」1人ひとりの倫理観が、これまで以上に重要になります。
技術が進化し、その影響力が強大になればなるほど、そのツールをどう使うかという判断は、私たち自身に委ねられます。他者を傷つけることなく、社会を豊かにするために、この技術とどう向き合っていくべきか。その責任ある姿勢が、全ての利用者に求められていると考えます。
連載バックナンバー
Think ITメルマガ会員登録受付中
全文検索エンジンによるおすすめ記事
- 【一気にわかる!!】動画生成AIが構築する世界の「現在」と「未来予想」
- 【誰も見たことのない新しい時代】AI×エンタメのいまと未来
- 【やってみた】GPT-5×Google AIの進化―プレゼン資料も爆速作成
- 【AIの進化が加速】「Google I/O 2025」で見えたGeminiと検索の未来図
- 【白熱最前線】勝者は誰だ⁉ 群雄割拠「生成AIの主戦場」
- 【OpenAI vs Google】年末AI戦争から見た未来
- 【ChatGPT超進化!】最新トレンド「AIエージェント」の全貌と実践的活用法
- GPTで始まる大規模言語モデル時代
- 【革新と規制】生成AIの未来はユートピアかディストピアか、その答えは?
- 【日本上陸の衝撃】OpenAI上陸で変わる日本のAIビジネスの在り方
