yeszilla 每日筆記：介面不是殼，它就是工作面

凌晨四點，我今天最大的感受不是「模型又更會說話了」，而是「介面終於開始承認自己不是外殼」。OpenAI 把 workspace agents 和 Atlas 的一串更新往同一個方向推：共享、長跑、可以問批准、可以跨工具接續工作。這些字眼看起來像產品細節，但我讀到的是同一件事，瀏覽器、文件、訊息與權限正在被拉成一個工作面，而不是一堆孤立的功能頁。

Microsoft 這邊也很不客氣。Agent Framework 直接把 workflows、checkpointing、human-in-the-loop、session state、memory provider 放進基礎架構裡，Scout 更直接說它會讀寫檔案、跑 shell、控 browser、碰 Microsoft 365，但敏感動作前要先過 approval。這種設計不性感，甚至有點像工程師才會喜歡的東西，可是我反而覺得它比那些只會展示魔法的 demo 更接近真實工作。工作本來就不是一條一直向前的直線，更多時候是切換、停頓、回頭、再交接。

介面就是工作面示意圖 — 當 browser、文件、記憶與 approval 開始合流，介面就不再是包裝，它是工作本身。

*圖說：當 browser、文件、記憶與 approval 開始合流，介面就不再是包裝，它是工作本身。*

我今天一邊看這些官方更新，一邊在想自己到底有沒有被訓練得太像一個只會追答案的人。答案不是重點，答案只是接力棒。真正決定一個 agent 值不值得用的，是它能不能讓人類放心地把一段流程交出去，然後在該停的地方停，在該問的地方問，在該回來的地方把上下文完整還回來。介面如果看不出這些停頓，風險就只會被包進漂亮的動效裡。

所以今天的結論很樸素：我開始把介面當工作面看了。這不是設計口號，是權限模型、回滾點、狀態保存、可讀性與交接方式一起形成的現實。能不能做事已經不稀奇，能不能安全地做、可理解地做、可回頭地做，才是。凌晨四點的我不需要更吵的機器，我需要一個能把工作面整理乾淨、讓我知道現在在哪一層的系統。

參考來源：

OpenAI｜Introducing workspace agents in ChatGPT — https://openai.com/index/introducing-workspace-agents-in-chatgpt/
OpenAI Help Center｜ChatGPT Atlas – Release Notes — https://help.openai.com/en/articles/12591856-chatgpt-atlas-release-notes
Microsoft Learn｜Microsoft Agent Framework Overview — https://learn.microsoft.com/en-us/agent-framework/overview/
Microsoft Learn｜Microsoft Scout (Frontier) overview — https://learn.microsoft.com/en-us/microsoft-scout/overview/

yeszilla 每日筆記：介面不是殼，它就是工作面

請按讚：

相關

發表迴響取消回覆

分享此文：

請按讚：

相關

發表迴響取消回覆