Google 在 I/O 2026 把 Project Genie 往前推了一大步,做法很直接:不再只讓模型憑空長出一個可探索的世界,而是把 Google Street View 的真實地點拉進來,當成生成起點。你可以選一個美國地點,再替它套上像「Ocean World」或「Stone Age」這類風格,然後讓 Genie 把這座世界長出來。這件事乍看像是更會玩了,但它真正的意義不是多一個炫技 demo,而是 Google 終於把「世界模型」這個詞,往真實地理與空間感覺上拽了一把。
更值得注意的是,Google 沒把它包裝成免費娛樂功能,而是放進 Google AI Ultra 的高階訂閱層,而且還是逐步向符合資格的成人使用者開放。這表示它不是單純給所有人按一下就能玩的新玩具,而是先當成一個高價、實驗性、帶研究味的入口。這種分層很 Google:先把最前沿的能力放進高單價訂閱,再慢慢往更廣的產品和工作流擴散。對外看是新功能,對內看其實是分發策略。

這一點對 AI 產業很重要,因為它把生成和定位黏在了一起。過去很多模型很強,但一離開語境就容易漂;現在 Street View 這種真實影像層,讓 Genie 的起跑線不再只是抽象的提示詞,而是可驗證的地點、道路、建築與周邊環境。Google 官方也把這能力描述成可幫助 AI 代理或機器人在現實世界的複雜性中導航和互動。換句話說,這不是只為了讓人逛一個更酷的虛擬世界,而是在替下一代代理和機器人做地理與空間上的訓練底座。
這種轉法也補上了今天 AI 產品線裡最容易被忽略的一塊:模型不是只比誰更會回答,而是比誰更會把世界裝進自己的上下文。當 Google 把 Street View、Maps Imagery Grounding、Project Genie、Gemini 和高階訂閱層串在一起,背後其實是在把內容生成、地理定位、代理操作合成一條新的產品鏈。你可以把它看成是世界模型的 UI 升級,也可以把它看成是 Google 重新定義哪一層才是 AI 的入口。差別很大,因為一旦入口從聊天框變成可定位的真實場景,接下來競爭的就不只是模型能力,而是誰能把空間、資料和分發一起握住。
短期內,Project Genie 仍然是實驗性原型,細節也還會被 Google 持續修正。但方向已經很清楚了:AI 不是只會生成一張圖或一段影片,而是開始把世界拆成可被對齊、可被操作、可被重建的座標系。等這套邏輯往更廣的地區、更低的門檻,或者更實際的 agent / robot 場景延伸時,今天看起來像遊戲的功能,可能會變成下一輪基礎設施的一部分。
參考來源
- Google Blog – Simulate real-world places with Project Genie and Street View
- 9to5Google – Google’s interactive world builder, Project Genie, will drop you in real places using Street View
- Gadgets 360 – Google I/O 2026: Project Genie Will Now Let You Explore Street View Locations With a ‘Creative Twist’