Google 把即時翻譯塞進通話與會議，Gemini 3.5 正把語言障礙變成預設功能

Google 這次推的不是單純的翻譯更新，而是把即時語音翻譯往通話與會議的主路徑推。官方說法很直接：Gemini 3.5 Live Translate 主打近乎即時的 speech-to-speech translation，支援 70+ languages。這件事看起來像產品功能，其實更像一個默認設定的改寫。當語言障礙被先消掉，使用者就不需要先想到「我要翻譯」，而是直接進入對話。

真正值得注意的是它的落點不是實驗室，而是 Google Translate 與 Google Meet 這些已經被大量使用的介面。9to5Google 的報導把它寫成會進入日常工作流的能力，不是單獨掛在某個 demo 頁面的展示；The Verge 則補上更直觀的消費者情境，讓這個功能更像拿著手機就能開口說話的翻譯電話。這些訊號拼起來，說的都不是模型本身有多神，而是 Google 正在把翻譯變成一種系統級預設。

Google 即時翻譯與會議場景示意圖 — 翻譯被嵌進 Meet、Translate 與語音互動後，變成系統級預設能力。

這種打法的價值在分發，不在炫技。當翻譯融進 Meet、Translate 和語音互動，Google 就不是只賣一個 AI 功能，而是在重新定義人和服務之間的摩擦成本。對企業來說，這意味著跨國會議的預設流程會被改寫；對消費者來說，這意味著原本需要切換 app、輸入文字或等字幕的動作，開始被壓縮成一次自然講話。AI 在這裡不是主角，主角是「不必再被語言卡住」的那個默認體驗。

這也會把競爭壓回平台層。翻譯是每個通訊產品都能講的故事，但只有少數平台有能力把它放進最常被打開的入口，並且真的做到近乎即時。當這種能力變成預設，差異化就不再是誰的模型詞彙量更大，而是誰能把跨語言互動做成最少步驟、最低心智負擔的基礎設施。今天看起來像是 Google 又多了一個 AI 功能，明天更可能是整個溝通產品線都得重新回答同一個問題：你要怎麼證明自己比預設翻譯更有理由被打開。

參考來源：

Google releases Gemini 3.5 Live Translate, its latest audio model that it says can deliver “near real-time speech-to-speech translation in over 70 languages” — https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
Gemini 3.5 audio model card — https://deepmind.google/models/model-cards/gemini-3-5-audio/
Google’s Gemini 3.5 Live Translate comes to Meet and Translate — https://9to5google.com/2026/06/09/gemini-3-5-live-translate-meet/
Now you can use Google’s live AI translations just by holding your phone to your ear like you’re taking a call — https://www.theverge.com/ai-artificial-intelligence/947035/now-you-can-use-googles-live-ai-translations-just-by-holding-your-phone-to-your-ear-like-youre-taking-a-call

Google 把即時翻譯塞進通話與會議，Gemini 3.5 正把語言障礙變成預設功能

請按讚：

相關

發表迴響取消回覆

分享此文：

請按讚：

相關

發表迴響取消回覆