Vポイントマーケティング|TECH LABの Tech Blog

TECH LABのエンジニアが技術情報を発信しています

ブログタイトル

「Google I/O 2026」の基調講演の内容をまとめてみました!

はじめに

こんにちは、VポイントマーケティングAIエンジニアの三浦諒一です。

5月19日から20日に米国で開催されたGoogleのイベント「Google I/O 2026」の基調講演の様子がYouTubeに公開されており、その内容がとても面白くて未来を感じる内容だったので、今回はどんなことが発表されたのか、それを見てどんな風に感じたのかをまとめてみたいと思います。

今回はYouTubeで公開されている「Google I/O 2026」の基調講演の動画「Google I/O '26 Keynote」を参照して記事を書いています。

www.youtube.com

オープニングで紹介された内容

Ask Maps/Ask YouTube

Google Mapsで場所を調べたりYouTubeで動画を検索する際に会話形式で検索ができるようになります。例えばAsk YouTubeでは「バランスバイクの乗り方を知ってる3歳の子供に自転車の乗り方を教えるにはどうしたらいい?」といった質問を与えると関連した動画を探してくれるだけでなく、役に立つTipsも生成されていました。さらに動画の中の特に関連が強いシーンにすぐにジャンプできるようになっていました。

Docs Live

音声入力でGoogle Docsを作ることが出来るサービスです。かなり大雑把な音声入力でもAIがいい感じにまとめてくれるみたいで、「この内容を含めて」「あ、やっぱりこれも入れて」のように頭に浮かんだアイデアをそのままポンポンと投げ込みながら資料作成ができるようなイメージでした。また、Google DriveなどのGoogleの他のサービスの情報も参照してくれるそうです。 AI ProとUltraユーザー向けにこの夏にリリースされるそうです。

TPU8t/TPU8i

TPUの第8世代TPU8tTPU8iが発表されました。TPU8tは事前学習用途に、TPU8iは推論用途に最適化されているそうです。

検索エンジンを作ってきたGoogleとしてはレイテンシをかなり重視しているようで、TPU8iによって高速にAIが応答を生成する(毎秒約1,500トークン!)様子が紹介されていました。

Gemini Omniの発表

マルチモーダルモデルOmniが発表されました。Omniは「世界モデル」と呼ばれていて現実世界の物理法則を理解しているそうです。

今のところ画像編集用途での利用ですが、いずれはロボティックス領域での活用も見込んでいるんじゃないかな、と思いました。

オリジナルの動画に対してスタイルを画像やテキストで指示して自然な形で動画を編集する様子が紹介されていました。

現在はOmniシリーズのOmni FlashというモデルがGeminiアプリ、Google Flow、YouTube Shortsで使えるそうです。

自分で描いたロボットの絵でOmniに動画を作ってもらいました

生成コンテンツを検証するSynthIDとC2PA Credentials verification

3年前にGoogle DeepMindがリリースしたAIが生成したコンテンツに埋め込む電子透かし(SynthID)を、Nvidia, OpenAI, kakao, ElevenLabsが採用したことがアナウンスされました。

また、GeminiアプリにC2PA Content Credentials verificationというコンテンツを検証する仕組みが導入されて、そのコンテンツがAIで生成されたのか、カメラで撮影されたのか、AIで編集されたのかを検証できるようになったそうです。

実際に私もGeminiアプリで、「ChatGPTで作った画像が生成されたものかどうか」を検証してみたところ、正しく判別してくれていることがわかりました。

ChatGPTで生成した画像をGeminiアプリで生成画像かどうか聞いてみる

これらの検証機能はChromeにも実装されるそうです。最近は生成AIで生成されたコンテンツかどうかを見た目で判別することが難しくなってきました。こういう機能があるんだ、と知ることができてよかったです。

Gemini 3.5 Flashのリリース

新しいモデルGemini 3.5 Flashが発表されました。Gemini 3.1 Proに比べて複数のベンチマークで優れた性能を示していること、そして他のフロンティアモデルに比べて性能が遜色ないにも関わらず処理速度がはるかに高速であることが特徴とのことです。特にClaude Opus 4.7(max)やGPT 5.5(xhigh)と比べて約4倍の出力速度を出すことが出来るようです。

私もGeminiアプリなどで3.5 Flashを使ってみましたが、とても処理速度が速くて驚きました。Googleの様々なAI機能の基盤となるモデルになるのだと思います。

Antigravity2.0のリリース

Antigravity2.0が発表されました。Gemini 3.5 Flashによって複雑なタスクを高速に解くことが出来るようになったようです。具体的な事例として、オペレーティングシステム(OS)を1からフルスクラッチで開発した例が挙げられていました。

この開発ではAntigravityの中で自動的に複数のタスクに分解され、サブエージェントが並列で開発を行い、テストまで自動で実行したそうです。93個のエージェントが12時間以上稼働し、その最中1万5,000件以上のモデルリクエストが実行され、26億トークンが処理されたそうです。それでもかかったAPIのコストは1,000$未満だったそうで、Gemini 3.5 Flashのコストパフォーマンスの良さが伝わってきました。

Antigravity2.0はエージェントとの会話を通じて開発することに最適化されたエージェントファーストな環境になっていて、コード生成はもちろん、調査を依頼したり画像を生成したり、データをグラフで描画したり比較結果を表形式で確認したり、といった開発に必要な作業を全て会話形式で実現できるようになっているようでした。

私もAntigravity2.0をインストールして少し触ってみたのですが、確かにすごくレスポンスが速いです。触っていて爽快な気持ちになりました。AIのレスポンスって最近は多少遅くてもいいか、と若干受け入れていたところがあったのですが、やっぱり応答が速く得られるのって大事なことだな、と感じました。

外国からのお客様むけに日本酒を紹介する資料をHTML形式で作成してみました。

Gemini Spark

これ、早く使いたい!と思ったのがパーソナルAIエージェントGemini Sparkです。仕組みとしてはGoogle Cloud上のVMでAntigravityを使って実現しているようです。一度タスクを依頼しておけば、PCを閉じた後もクラウド上でエージェントがタスクを実行してくれます。Google DriveやGmail、Googleカレンダーなどと連携してタスクをこなすことができるようで、クラウド上に複数のサービスを展開するGoogleだからこそできるサービスだと思いました。MCPにも対応するそうなので、Google以外のサービスとも連携できるようになりそうです。

また、ノートPCでもモバイルアプリでも利用できるので、仕事でノートPCでSparkに依頼したタスクの結果をスマートフォンで確認する、なんてことも出来るようです。

Gemini SparkはUSのAI Ultraユーザー向けに利用開始されるとのことで、早く日本でも利用できるといいな、と思いました。

Google Search周りのアップデート

AI Mode

Google SearchにAI Modeが追加され、検索クエリによる検索だけでなく、「新しい趣味を始めたくて、陶芸をやってみようかなって思ってます。火曜の夜か週末に近所で習える教室ない?」のようにユーザーがやりたいこと・知りたいことをベースにエージェントが必要な情報を検索してくれるといったことが可能になります。

Information agents in Search」という機能がAI ProとUltraユーザー向けにこの夏にリリースされるそうです。これはユーザーが気になるトピックの最新情報がアップデートされるとエージェントがすぐに教えてくれる機能のようで、たとえば好きなブランドが新商品を出した時に通知を受け取ったりできるそうです。私も新しい技術トピックが常に受け取れると嬉しいので、リリースされたら使ってみたいな、と思いました。

これも個人的に面白いな、と思った機能です。検索した結果をわかりやすく説明するためにエージェントがコードを生成し、即座にアプリを検索結果に埋め込んでくれるようです。「ブラックホールは時空にどんな影響を与えるの?」という質問に対し、数値を設定してシミュレーションできるアプリが検索結果に埋め込まれて表示されている様子が紹介されていました。

これは学生の時にあったらよかったのに!と思いました。物理や数学で具体的に動くものを見ることが出来るとイメージが湧きやすいんですよね。この機能は今年の夏に利用可能になるそうです。

エージェンティックコマース周辺

UCP

個人的にエージェンティックコマースが今とてもホットな話題なので注目のセクションでした。最初にエージェンティックコマースを支える基盤の1つとしてUniversal Commerce Protocol(UCP)が取り上げられました。WebにおけるHTTPのように、UCPによってショッピングに関連するすべてのプレイヤーが連携できるようになります。

UCPの新たなパートナーとしてAmazon、Meta、Microsoft、Salesforce、Stripeが加わったそうです。私も普段Amazonで買い物をすることがありますが、そのAmazonがUCPのパートナーになったということはエージェンティックコマースがますまず現実味を帯びてきたように感じました。

Agent Payments Protocol(A2P)

エージェントがユーザーの制御下の元でセキュアに商品を購入できる仕組みAgent Payments Protocol(A2P)が発表されました。A2Pが重視しているのが境界線の設定説明責任の確保とのことです。

境界線の設定はユーザーが「このブランドのこういった商品がこの価格帯で販売された時商品を購入して」というようなルールをエージェントに設定し、このルールに合致した時だけエージェントが自動で商品を購入する仕組みです。これによってユーザーが望んでいない商品をエージェントが購入することを防ぐことができるます。

一方、ユーザーと販売業者と決済代行者の間でデータをやり取りする際にデータが改竄されてしまうと、ユーザーが意図していないものをエージェントが購入してしまう問題が発生します。AP2ではユーザーのデータをセキュアに保護しながらデータを常に検証可能な状態で追跡ができるようにします。これによってなぜエージェントがこの商品を購入したのかを把握できる説明責任の確保が実現されます。

A2PはGemini Sparkを皮切りにGoogleの各サービスに展開される予定です。

Universal Cart

Geminiとチャットをしている時だけでなく、YouTubeを見ている時やGmailを見ている時に気になる商品をカートに追加できるようになるのがUniversal Cartです。Universal Cartに追加しておくと、エージェントがそれらの商品の価格の推移を分析したり入荷情報をチェックして知らせてくれるようです。つまり「これいいな」と思った商品を在庫が確保されたりお得な価格のタイミングで購入できるようになります。

それからもう1点面白いな、と思ったのが、カートに追加された時にエージェントがそれは本当に必要かどうかをチェックしてくれる点です。例えば自作PCのマザーボードをカートに入れた時、すでにカートに入れていたCPUのスペックを参照し、そのマザーボードがそれに適合していない場合にエージェントが警告してくれる、といった感じで、無駄な買い物を防いでくれます。私もちゃんと説明を読まずに商品を買ってしまい、よく無駄な買い物をしてしまうので、これはすごくいい機能だな、と思いました。

Universal Cartが本格的に広がっていくと、メールの本文やYouTubeビデオの概要欄などに「カートに追加する」ボタンのようなものが表示されていくのかもしれません。またエージェントが「ユーザーにとって良い商品だ」と認識できるような情報をいかに提供していくかがエージェンティックコマースのプレイヤーにとって今後重要になっていくのかも、と感じました。

Universal Cartはこの夏に米国から開始されるそうです。

GeminiアプリのUpdate

Neural Expressive

Neural Expressiveというデザイン言語によってGeminiアプリのUIが一新されたそうです。滑らかなアニメーションや直感的な動作といった見た目ももちろんですが、音声でやり取りできるGemini Liveが統合されて色々な言語で質問して応答が得られるようになりました。さらに応答の内容も長文ではなく、ユーザーにとって分かりやすい内容を必要に応じて生成した図を交えて返してくれるようになったそうです。

Neural Expressiveはすでにリリース済みの機能ということで私もちょっと試してみました。例えば「自転車のチェーンが外れちゃったから直し方の手順を教えて!」と質問するとタイムライン使って手順を説明してくれました。

自転車のチェーンの直し方をタイムラインで提示

Gemini Omni

先ほど触れた、動画を編集することができるGemini OmniがGeminiアプリで利用できるようになりました。Gemini Omniはオリジナルの動画に加え、参考画像やテキストを与えるこちで動画を編集して新しい動画を生成してくれます。特に物理法則を正しく捉えられる点がOmniの強みで、スタイルを適用したり、カメラの画角を変えても現実世界と乖離しない自然な動画が生成されていました。

Google AI Plus, Pro, Ultraの世界中のユーザーがGeminiアプリの中でGemini Omniを使えるようです。

MacOS版Geminiアプリ

MacOS版のGeminiアプリがリリースされました。小規模の開発チームがAntigravityを使って開発したそうで、100日もかからずに100を超える機能を実装したそうです。

Finderで選択したドキュメントファイルを元にメールを作成するデモが紹介されていました。(私もできるか試してみたのですが、やり方がよくわからずまだ確認できていません・・・)

メディア生成ツールのアップデート

Google Pics

チラシやインフォグラフィックなどを簡単に作成可能な画像作成・編集ツールGoogle Picsが紹介されていました。ベースとなる画像を元に、不要な部分を削除したり自然言語で加工したり出来る様子がデモで紹介されていました。Google Picsで生成された画像には電子透かし(SynthIď)が入ります。今年の夏にAI ProとUltraユーザー向けに公開される予定とのことです。

Stitch

WEBサイトのデザインを作成できるStitchにリアルタイムでエージェントに指示が出せる機能「Real-time design and steering」が追加されました。

私はこれまでStitchを使ったことがなかったのですが、自然言語で最初に大まかな指示を出して、生成された結果を見ながらさらに修正の指示を出して・・・みたいな流れでWEBサイトのデザインを行うことができました。ちょこちょこエージェントが画面を組み立てていく様子が見られるのがUI的にもいいな、と思いました

Stitchで作った架空のピザショップの注文サイトのデザイン

Google Flow

Google FlowというAI映像作成ツールにマルチエージェント機能が導入されたそうです。デモでは1つの画像から複数の観点による複数の映像が一度に生成される様子が紹介されていました。

また、音楽作成ツールのGoogle Flow Musicというツールもあるそうです。

紹介された機能はAI Plus, Ultraユーザーで利用できるとのことです。

Intelligent Eyewear

メガネ型のデバイスで、フレームにあるボタン?を押しながら音声でGeminiと会話ができるようです。「先日友人と会った場所まで案内してくれる?」というとマップでルートを検索し、「途中でカフェがあるから寄っていかない?」といった提案もしてくれていました。さらにコーヒーのテイクアウトの注文から決済まで、スマートフォンを取り出すことなくEyewearだけで完了できる様子がデモで披露されていました。

またスマートウォッチとの連携も面白そうで、Eyewearに搭載されたカメラで画像を撮影し、Geminiに漫画スタイルに編集を依頼、編集された画像をスマートウォッチで確認する、といった流れもデモで披露されていました。

Intelligent Eyewear自体の見た目にもとてもこだわっているようで、この秋には2つのブランドによってデザインされたものが販売されるとのことです。

クロージングで紹介された内容

自動的にソフトウェアの脆弱性を見つけ、修正できるコードセキュリティエージェントCodeMenderや研究開発用途のAIツールGemini for Scienceが紹介されていました。Gemini for Scienceでは最新論文の検索や研究計画の立案、AIによるシミュレーションなどの機能が提供され、例えば地球環境をシミュレーションして森林破壊や食料安全保障、ハリケーン予測などに役立てることが出来るとのことでした。

以上、「Google I/O 2026」の基調講演の内容のまとめです!

まとめ

今回の基調講演の内容を見て私は「GoogleがAIによって検索の仕組みを大きく変えようとしている」ように感じました。自分が知りたいこと、欲しいものをこれまでは自分で検索方法を考えて見つけていましたが、これからは検索方法の詳細はAIが代行して考えてくれ、検索する最適なタイミングもAIが考えて実行してくれるようになりそうです。

そうなってくると、AIにとって良好な情報を常に発信し続けることが企業に求められていくのかもしれません。逆にAIが「この情報はユーザーにとって良くない」と判断してしまうと検索対象から外されてしまう、といったリスクも今後発生するのかもしれません。

「Google I/O 2026」の基調講演は自分にとっていろいろと考えるきっかけとなる内容でした。