【やってみた】GPT-5×Google AIの進化―プレゼン資料も爆速作成

AI・人工知能

ニュース

連載 [第45回] :

Gen AI Times

2025年8月21日(木)

鍋谷美帆

本記事は、生成AIコミュニティ「IKIGAI lab.」に所属するメンバーが、生成AIに関するニュースを紹介＆深掘りしながら、AIがもたらす「半歩先」の未来に皆さんをご案内します。

はじめに

本連載では、生成AIコミュニティ「IKIGAI lab.」に所属する各分野の専門家が、それぞれの視点から最新のAIトレンドとビジネスへの示唆を発信しています。本記事を通じて、皆さまが“半歩先の未来”に思いを馳せ、異なる価値観に触れていただければ幸いです。

2025年8月7日、OpenAIがついに「GPT-5」をリリースし、生成AI界隈に新たな衝撃が走りました。一方で、Googleも「Genie 3」という革新的なワールドモデルを発表するなど、生成AIの進歩は留まることを知りません。

今回は、OpenAIとGoogleの最新AIアップデート状況を整理し、「やってみた」体験も交えながら、生成AIがもたらす新しい可能性を探っていきましょう。

GPT-5登場！“最適解”を自動で届ける時代に

2025年8月7日、OpenAIは新世代大規模言語モデル「GPT-5」を発表しました。OpenAIのフラッグシップモデルと位置づけられるGPT-5は、GPT-4oから大幅にアップグレードされた新モデルで、その回答レベルは「博士レベルの専門家」と対話しているかのような体験を提供すると言われています。

【出典】「GPT-5のご紹介：OpenAI」(OpenAI 2025/08/07)

モデルの統合・自動選択

GPT-5の導入に伴い、GPT-4oやo3などの旧モデルはGPT-5に統合されました。その最大の特徴は「リアルタイム・ルーター」機能です。従来のようにユーザー自身が「簡単な会話用」「推論用」などとモデルを使い分ける必要がなくなり、ユーザーからの質問の難易度に応じて、速度重視のGPT-5と推論重視のGPT-5 Thinkingを自動で切り替えます。簡単な問いには素早く回答し、複雑な問いには時間をかけて綿密に推論する柔軟な動作を実現しています。

性能ベンチマークの飛躍

公式ベンチマークによれば、GPT-5は幅広い分野で過去最高水準の精度を記録しました。

数学・論理思考：AIME(米国数学コンテスト)でGPT-5のツールなしでは94.6％、GPT-5 Proのツールありでは100％の正解
プログラミング：SWE-bench Verified(実在のソフトウェア不具合修正課題)で74.9%を達成
マルチモーダル理解：MMMU(テキスト・画像組み合わせ評価)で84.2%

特にコーディング能力の向上は顕著で、「Webアプリやインタラクティブなゲームが一発で生成できた」という事例も珍しくありません。

高校レベルの難問に対する数学能力を測るテスト
with thinking：推論あり
without thinking：推論なし
no tools：ツール使用なし
python：ツール使用あり

コーディング能力を測るテスト
with thinking：推論あり
without thinking：推論なし

図表や写真を含むマルチモーダル理解を測るテスト
with thinking：推論あり
without thinking：推論なし

信頼性・安全性の向上

性能だけでなく、実用性も大幅に改善されています。OpenAIのシステムカードによると、GPT-5はGPT-4oと比べてハルシネーション率が26％減少しており、より信頼できる回答を提供しています。

さらに「セーフ・コンプリーション(Safe Completion)」という新たな安全性アプローチも導入されました。危険な指示に対して単純に拒否するのではなく、安全な範囲で有益な情報を返す仕組みです。実用性と安全性を両立させた画期的な機能と言えるでしょう。

【参照】
「GPT-5のご紹介」(OpenAI 2025/08/07)
「GPT-5(ChatGPT5)とは？料金や使い方、GPT-4との違いを解説！」(SHIFT AI TIMES 2025/08/14)
「【無料公開】GPT‑5アップデート総まとめ—Thinking自動切替、API強化、Codex CLI対応まで」(ChatGPTlab 2025/08/08)

実際の活用例

OpenAIからコーディングデモ集が公開されているほか、公開から一週間も経たぬうちに数々の活用事例が報告されています。

テキスト指示から、操作できるシンセサイザーを生成

【出典】「X Sam Altman」(2025/08/08)
リアルタイムの宇宙3Dシミュレーションを生成

【出典】「X AJ Ghergich」(2025/08/09)
テキスト指示から3D FPSゲームを作成

【出典】「X あきらパパ【生成AI活用エンジニア&３児のパパ】」(2025/08/08)
他AIと掛け合わせた事例「NotebookLMで得た資料要約を基に、GPT-5の推論で本質的な課題を引き出す」

【出典】「X えーたん/AI×時短で仕事効率化」(2025/08/09)

Google AI群雄割拠ー多方面からの技術革新

OpenAIに限らず、Googleからも負けじと革新的なAI技術が相次いで発表されています。

Genie3：テキストからインタラクティブな3D世界を自動生成

【出典】「Genie 3: 世界モデルの新たな境地」(Google DeepMind 2025/08/05)

Google DeepMindが発表したGenie 3は、テキストプロンプトから操作可能な3D仮想世界をリアルタイム生成できる世界モデルです。シンプルな指示だけで、まるでゲームのようにナビゲート可能な世界を作り出します。

技術仕様の概要は以下の通りです。

解像度：720p ・24フレーム/秒でのリアルタイム映像生成
一貫性保持：数分間にわたる視点移動時の世界観の維持
プロンプト可能なワールドイベント：テキスト指示による天候変化や新しいオブジェクトの追加

特に驚異的なのは”環境記憶”機能で、例えばユーザーが世界内の壁をペンキで塗った場合、その壁が視界から外れても塗られた状態が残っているなど、物理的に一貫した状態を数分間維持できます。さらに、天候変化や新しいオブジェクトの追加といった世界の動的編集も可能です。

現在は限られた研究プレビューとして、一部の学者やクリエイターのみに先行アクセスが提供されている状況です。

【参照】
「Genie 3: 世界モデルの新たな境地」(Google DeepMind 2025/08/05)
「Google DeepMind、リアルタイムで世界を生成するAI「Genie 3」発表 “AGIへの足がかり”」(ITmedia AI+ 2025/08/06)
「GoogleのAI、ついにプロンプトだけで"世界"を生成可能に」(PC Watch 2025/08/06)

NotebookLM Video Overviews：資料が動画プレゼンに変身

NotebookLMは、Googleドキュメント、PDF、ウェブサイトリンクやYouTube動画などをソースとして、要約やFAQを生成できるGoogleのAIサービスです。2025年7月29日のアップデートでは、従来の音声解説に加えて「動画解説(Video Overviews)」機能が追加されました。

この機能により、PDFやファイルなどをアップロードするだけで、AI音声ナレーション付きのスライド動画の生成が可能となりました(2025年8月11日時点では英語のみ対応)。

【参照】
「What’s new in NotebookLM: Video Overviews and an upgraded Studio」Google(2025/07/29)
「Google’s NotebookLM can now make narrated slideshows with AI 」The Verge(2025/07/30)
「NotebookLM の動画解説の概要」npaka(2025/07/30)

Gemini：Storybook機能で絵本生成が可能に

Google AIの進化はGenie3やNotebookLMに留まりません。2025年8月5日、任意のトピックを入力するだけで、イラスト・音声ナレーション付きの絵本を10ページ自動作成する新機能「Storybook」をリリース。テキストだけでなく、PDFやイラストなどを物語に取り入れることも可能です。

【参照】「絵本が魔法みたいに数分で完成！？Gemini Storybookとは？使い方を徹底解説」WEEL(2025/08/08)

実践：NotebookLM×GPT-5で日本語プレゼン資料を作成

前述の通り、NotebookLMの動画解説は日本語に対応していませんが、生成される動画解説はわかりやすく感じ、その手軽さとクオリティに驚きました。

そこで、私は考えたのです。「このプレゼン動画を日本語に要約して、そのまま自分のプレゼン資料にできないだろうか」と。マルチモーダル理解力がアップしたGPT-5なら可能なのではないかと、試してみました。

Step1：NotebookLMで動画解説(英語版)を作成

今回はこちらの記事をインプットし、説明動画を作成します。「ソースを追加」→「ウェブサイト」からURLを入れて、「動画解説」を押すだけで、プレゼン動画が作成できます。

実際の動画はこちら。

Step2：ChatGPT-5で日本語版のPowerPoint資料と原稿を作成

次に、GPT-5にこの動画を再現した日本語版PowerPointと原稿(txt)を作ってもらいます。普通にGPT-5で動かすとタイムアウトしてしまったので、エージェントモードを使用したところ、作成できました(所要時間約30分)。

実際のプロンプトはこちら。【】内を変えることで使い回せます。

#前提条件
添付の動画は、【生成AIについて】英語で解説されたものです。この動画にはスライド資料と音声による解説が含まれている。
ASSISTANT(あなた)はプロの翻訳者かつプレゼン資料作成の専門家として、動画のスライドおよび音声解説を日本語化し、デザインを忠実に再現したPowerPoint資料と日本語の解説原稿を作成する。

#ゴールと変数の定義
ゴール：
- 英語スライドを日本語に翻訳し、体裁・レイアウトを可能な限り動画のオリジナルに忠実に再現するPowerPointを作成する。
- 動画内の英語解説を自然でわかりやすい日本語に翻訳した原稿を作成する。

変数：
- 元動画のスライド構成・デザイン
- スライド内の英語テキスト
- 音声解説の全文(英語)
- 日本語翻訳における語調(専門性を保ちつつ、わかりやすく)
- フォント・色・図形レイアウトなどのデザイン要素

#手順の実行プロセス
[C1] 動画から各スライドの静止画を抽出し、スライドごとの英語テキストを正確に転記する。
[C2] 音声解説を文字起こしし、スライド単位で紐づける。
[C3] 英語テキストおよび解説文を自然な日本語に翻訳する。翻訳は直訳ではなく、専門用語の正確さと日本語としての自然さを両立させる。
[C4] オリジナルのスライドデザインを分析し、フォント、色、レイアウトをPowerPointで再現する。
[C5] 翻訳済みの日本語テキストをスライドに配置し、レイアウト崩れを修正する。
[C6] 日本語化された解説原稿をスライド順にまとめ、別ファイルとして納品できる形に整える。
[C7] 全スライドと原稿を最終チェックし、英語→日本語の意味の正確さ、デザインの再現度、表現の自然さを確認する。

#出力形式
- 日本語スライド(PowerPointファイル)
- 日本語解説原稿(Wordまたはテキストファイル)

#制約事項
- スライドのデザインは可能な限り動画オリジナルに忠実に再現する。
- 専門用語は正確性を優先するが、一般視聴者にも理解できる日本語にする。
- 原稿はスライドごとに対応し、読み上げを想定した自然な文章にする。
- 不明確な部分は推測せず、[不明]と記載する。

Step3：結果を確認

出力されたPowerPointがこちら。日本語訳や体裁が不自然なところはありますが、スライドのデザイン性はかなり再現できているのではないかと思います。

一方で、原稿の方は元動画の語りがかなり要約されていて、このままでは使いにくい印象を受けました。

もちろん、プロンプトや他の方法で改善できる可能性がまだまだあります。読者の皆様も、ぜひ試してみてください。

おまけ：絵本の作成にチャレンジ

試しにGemini Storybookで絵本を作成してみました。プロンプトは「以下の内容を先生が小学生の生徒に教える絵本を作って。：(以下記事の文章)」のみです。最初の数ページは正直”難しいかな”と思ったのですが...

読み込ませた記事の要諦である「プロンプト設計」について伝える絵本ができました

実際の絵本はこちら。

しっかりとストーリー仕立てで、絵本らしい内容になっているところにも驚いています。教育にも活用できる可能性が高いのではないでしょうか。筆者が子ども時代に欲しい機能でした。

まとめ

GPT-5とGoogle AI群の技術革新により、AIツールは様々な作業を劇的に加速しています。1つのツールのみでなく、効率を損ねない範囲でいくつかのツールを掛け合わせていくと、さらに一歩進んだ使い方ができるのではないでしょうか。NotebookLM×GPT-5、Gemini Storybook×自分のアイデア、etc…組み合わせは無限大です。まずは気軽に、これらの新しいツールで遊び倒しましょう！