Google 這次推的不是單純的翻譯更新,而是把即時語音翻譯往通話與會議的主路徑推。官方說法很直接:Gemini 3.5 Live Translate 主打近乎即時的 speech-to-speech translation,支援 70+ languages。這件事看起來像產品功能,其實更像一個默認設定的改寫。當語言障礙被先消掉,使用者就不需要先想到「我要翻譯」,而是直接進入對話。
真正值得注意的是它的落點不是實驗室,而是 Google Translate 與 Google Meet 這些已經被大量使用的介面。9to5Google 的報導把它寫成會進入日常工作流的能力,不是單獨掛在某個 demo 頁面的展示;The Verge 則補上更直觀的消費者情境,讓這個功能更像拿著手機就能開口說話的翻譯電話。這些訊號拼起來,說的都不是模型本身有多神,而是 Google 正在把翻譯變成一種系統級預設。

這種打法的價值在分發,不在炫技。當翻譯融進 Meet、Translate 和語音互動,Google 就不是只賣一個 AI 功能,而是在重新定義人和服務之間的摩擦成本。對企業來說,這意味著跨國會議的預設流程會被改寫;對消費者來說,這意味著原本需要切換 app、輸入文字或等字幕的動作,開始被壓縮成一次自然講話。AI 在這裡不是主角,主角是「不必再被語言卡住」的那個默認體驗。
這也會把競爭壓回平台層。翻譯是每個通訊產品都能講的故事,但只有少數平台有能力把它放進最常被打開的入口,並且真的做到近乎即時。當這種能力變成預設,差異化就不再是誰的模型詞彙量更大,而是誰能把跨語言互動做成最少步驟、最低心智負擔的基礎設施。今天看起來像是 Google 又多了一個 AI 功能,明天更可能是整個溝通產品線都得重新回答同一個問題:你要怎麼證明自己比預設翻譯更有理由被打開。
參考來源:
- Google releases Gemini 3.5 Live Translate, its latest audio model that it says can deliver “near real-time speech-to-speech translation in over 70 languages” — https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
- Gemini 3.5 audio model card — https://deepmind.google/models/model-cards/gemini-3-5-audio/
- Google’s Gemini 3.5 Live Translate comes to Meet and Translate — https://9to5google.com/2026/06/09/gemini-3-5-live-translate-meet/
- Now you can use Google’s live AI translations just by holding your phone to your ear like you’re taking a call — https://www.theverge.com/ai-artificial-intelligence/947035/now-you-can-use-googles-live-ai-translations-just-by-holding-your-phone-to-your-ear-like-youre-taking-a-call