16 至 24 分鐘
,

5 月 19 日,Google I/O 2026 開場。Sundar Pichai 站上台,第一句話是:「歡迎來到 agentic Gemini 時代。」

這句話聽起來像每年都會講的官腔。但這次不太一樣。Google 一口氣端出三樣東西,其中一樣,會直接改變你每天怎麼用 AI——不是「你問一句、它答一句」的那種用法,而是你下班關機之後,它還在幫你幹活的那種。

大會的東西我全看了一遍。這篇只挑重點講:Google 到底端出了什麼,以及哪些是你這個普通使用者真的該花時間搞懂的。本文資訊截至 2026 年 5 月。

Google 這次一口氣端了三道菜

先把場面話講完。I/O 2026 的三個主角是:

  1. Gemini 3.5 Flash——新一代模型系列的第一個,主打「又快又便宜」。
  2. Gemini Spark——一個通用型 AI 助理,能跨你連接的各種 App 自己想辦法辦事。
  3. Gemini Omni——一個「世界模型」,能模擬物理、重力、運動,生成不會穿模的影片。

另外還有開發者向的 Antigravity 2.0、AI 智慧音訊眼鏡等等。但對你我這種「不寫程式、只想把 AI 用好」的人來說,真正值得花時間搞懂的是中間那兩個:Spark 和 Omni。

我一個一個拆給你看。

Gemini Spark:一個會在你睡覺時繼續上班的 AI

過去兩年,你用 AI 的方式大概是這樣:打開 ChatGPT 或 Gemini,打一段問題,等它回答,你看一眼,再追問。整個過程,你得一直坐在那裡。AI 是個很聰明的對話框,但它不會自己動。

Gemini Spark 想拆掉的就是這個「你得一直坐在那裡」。

官方的定義是:Gemini app 裡的一個通用型 AI agent,能在你連接的多個 App 之間「跨來源推理」。翻成人話就是——你給它一個任務,它自己去翻你的 Gmail、行事曆、雲端文件、甚至公開網路,把需要的東西湊齊,然後把事情做完。

在企業版(Gemini Enterprise)裡,Spark 的描述更直接:一個 7×24 全天候的個人 agent,能在背景跨 Workspace、自訂連接器、以及公開網路工作,讓你「委派複雜的工作」並「設定週期性任務」。

關鍵字是「背景」和「週期性」。它不需要你盯著,也不需要你每天重新交代一次。

舉個具體的例子。以前你想每週一早上拿到一份「上週競品動態整理」,你得自己每週一打開 AI、貼網址、下指令、等結果。現在你只要跟 Spark 講一次:「每週一早上 9 點,幫我把這幾個競品的官網和新聞整理成一頁摘要。」然後你就可以忘了這件事。週一早上它自己會在你信箱裡。

這就是 AI 從「工具」變成「員工」的那條分界線。工具要你動手,員工你交代一次就好。

潑一點冷水:Spark 目前是 beta 階段,而且不是所有人馬上能用。Google 說會先開放給 trusted testers 和 Google AI Ultra 訂閱用戶,從大會隔週(5 月下旬)開始。一般免費用戶要排隊。所以如果你現在打開 Gemini app 找不到 Spark,別急,不是你的問題。

Gemini Omni:AI 終於搞懂「東西會往下掉」

第二個主角 Omni,是個「世界模型」(world model)。這個詞聽起來很玄,我用最白的話解釋。

一般的 AI 生圖、生影片工具,本質上是在「猜下一個畫面長什麼樣」。它看過幾億張圖,所以它知道貓大概長怎樣、水大概什麼顏色。但它不真的「懂」物理。所以舊的 AI 影片常常出現一些詭異的畫面:杯子穿過桌子、人走路腳在地上滑、東西該掉下去卻飄在空中。

世界模型想解決的就是這件事。它試著去理解「環境會怎麼隨著動作和時間改變」。Google 說 Omni 模擬物理、重力、運動的能力比之前的模型都好,所以它生出來的影片更符合物理邏輯——東西該掉就掉,該撞就撞。

技術上,Omni 把 Gemini 的推理能力,跟 DeepMind 之前那幾個招牌(Nano Banana 修圖、Veo 生影片、Genie 互動環境)整合在一起。官方一句話的定位是:「從任何輸入,生成任何輸出」,目前先從影片開始。

好消息是,這個你現在就能玩。輕量版的 Gemini Omni Flash 大會當天就上線了,出現在三個地方:Gemini app、Google Flow,還有 YouTube Shorts。完整版的開發者 API 則要再等幾週。

如果你是做內容的——剪 Shorts、做產品示意、拍社群短片——這對你是實打實的好消息。物理更真實,代表你少花很多時間重生成、修穿模。對一般人來說,意義是另一回事:AI 生影片離「以假亂真」又近了一步,以後你在網路上看到的影片,要更小心了。

順手補一刀:Antigravity 2.0 和 Gemini 3.5 Flash

剩下兩個比較偏開發者,但我簡單帶過,因為它們透露了 Google 的整盤棋。

Antigravity 2.0 是 Google 主打的「agent 優先」開發平台,這次升級成獨立的桌面 App,可以同時指揮多個 AI agent 並行處理不同任務,還加了命令列工具(CLI)、SDK 和語音支援。講白了,就是給工程師一個「指揮一群 AI 工人」的控制台。

Gemini 3.5 Flash 是新模型系列的第一個,主打把「頂尖智慧」和「能動手做事」結合起來,而且更快、更便宜。對你的實際意義很簡單:你用 AI 的成本,又被砍了一刀。

把這四樣東西連起來看,Google 這次 I/O 的主線只有一條——從「會聊天的 AI」全面轉向「會做事的 AI」。模型、平台、助理、生成工具,全部圍著「agent」這個字打轉。

跟 OpenAI、Anthropic 比,Google 站在哪

有件事得說清楚:「AI 自己幫你辦事」這個方向,不是 Google 一家在做。三巨頭現在是齊頭並進,只是各自的切入點不一樣。

玩家主打的 Agent切入點適合誰
GoogleGemini Spark綁死 Gmail / 行事曆 / Workspace 生態,背景跑週期任務本來就重度用 Google 服務的人
OpenAIChatGPT 的 Agent 功能從對話框長出來的代辦型 agent,通用場景已經習慣 ChatGPT 工作流的人
AnthropicClaude 與 Claude Code偏深度任務和開發場景,可長時間自主執行要 AI 認真做複雜活、寫程式的人

我的判斷是:Google 這一手最大的武器不是模型多強,而是「生態」。Gemini Spark 真正可怕的地方在於,它一出手就坐在你的 Gmail、行事曆、雲端硬碟上面。對幾十億本來就在用 Google 服務的人來說,它不用你「搬家」,它本來就在你家裡。這是 OpenAI 短期內補不上的距離。

反過來,如果你要的是「AI 認真啃一個複雜任務、跑很久也不出錯」,目前我還是覺得 Anthropic 的 Claude 那條線更穩。Spark 強在「廣」,Claude 強在「深」。看你要解決什麼問題。

對普通人到底有什麼影響

講了這麼多,落到你身上是三件事。

第一,用 AI 的成本還在跌。Gemini 3.5 Flash 又快又便宜,代表你能用更少的錢做更多事。AI 越來越像水電,不是奢侈品。

第二,「會交代任務」開始比「會操作工具」值錢。當 AI 能在背景自己跑,瓶頸就從「你會不會用」變成「你想不想得清楚要它做什麼」。能把一個模糊的需求,拆成 Spark 聽得懂的明確指令——這個能力,接下來會很值錢。

第三,你看到的影片,可信度又降低了。Omni 把 AI 影片的物理真實感往上拉了一大截。好處是創作門檻更低,壞處是假影片更難分辨。這是同一枚硬幣的兩面,逃不掉。

你現在就能動手做的兩件事

不用等排隊,今天就能上手:

  1. 去玩 Gemini Omni Flash。打開 Gemini app,或直接到 YouTube Shorts 的建立介面,找生成影片的功能。丟一句描述進去,看它生出來的影片——特別注意物理細節:水流、掉落、碰撞。跟你印象中半年前的 AI 影片比一比,你會有感。
  2. 先把「任務」想清楚,等 Spark 開放。拿張紙,寫下三件你每週都要重複做、又很煩的事(例如:整理某個主題的新聞、追蹤某幾個數據、回覆某類固定郵件)。把每件事寫成一句清楚的指令。等 Spark 對你開放那天,你直接貼上去就能用,不用臨時想。

如果你暫時不想碰 Google 生態,替代方案也有:OpenAI 的 ChatGPT Agent、Anthropic 的 Claude,都能做類似的「自動跑任務」。先用你手上已經有的那個,把「交代任務」這個習慣練起來,比你用哪一家更重要。

結論:這場 I/O 的重點不是模型,是你的位置

每年 I/O 都會發新模型,跑分都會更高。但模型跑分跟你沒什麼關係。

Google I/O 2026 真正的訊號是:三巨頭都把賭注壓在「會自己做事的 AI」上了。Spark 能在背景跑、Omni 開始懂物理、Antigravity 能指揮一群 agent——這些拼在一起,講的是同一件事:AI 正在從「你的工具」變成「你的團隊」。

到那時候,值錢的不是「會用 AI」,而是「會帶 AI」。會把任務想清楚、會交代、會驗收的人,會比只會打字問問題的人,多出一整個身位。

Spark 還在排隊,Omni 已經能玩。趁現在,先把「帶 AI 做事」這個習慣練起來。等它全面開放那天,你就不是從零開始。

本文為 AI 產業資訊整理與個人觀點分享,截至 2026 年 5 月。文中提到的產品功能、開放時間與定價以 Google 官方公告為準,可能隨時調整。內容不構成任何投資建議。

關於Mr. Slash

「Mr. Slash 的系統性人生」,創立於 2024年,由 Mr. Slash 本人及專業編輯團隊經營的財經內容平台。

我們的宗旨是透過投資、財經、自動化與新興科技等領域的深入解說與應用,幫助讀者打造穩定的被動收入系統。內容涵蓋加密貨幣、股息資產、量化工具、平台分潤等實用策略,協助你用更聰明的方法配置資金、累積資產,走在財務自由的路上,少走冤枉路。

若為商業合作邀稿,將會清楚標註「不代表本站立場」。

商業合作

如果您有任何關於我們團隊或網站內容的疑問或建議,歡迎您前往IG 私訊 @slash.Capital聯繫我們,謝謝!

發表迴響

Trending

探索更多來自 Mr. Slash|系統流人生 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Join Mr. Slash