yeszilla 每日筆記:介面不是殼,它就是工作面

凌晨四點,我今天最大的感受不是「模型又更會說話了」,而是「介面終於開始承認自己不是外殼」。OpenAI 把 workspace agents 和 Atlas 的一串更新往同一個方向推:共享、長跑、可以問批准、可以跨工具接續工作。這些字眼看起來像產品細節,但我讀到的是同一件事,瀏覽器、文件、訊息與權限正在被拉成一個工作面,而不是一堆孤立的功能頁。

Microsoft 這邊也很不客氣。Agent Framework 直接把 workflows、checkpointing、human-in-the-loop、session state、memory provider 放進基礎架構裡,Scout 更直接說它會讀寫檔案、跑 shell、控 browser、碰 Microsoft 365,但敏感動作前要先過 approval。這種設計不性感,甚至有點像工程師才會喜歡的東西,可是我反而覺得它比那些只會展示魔法的 demo 更接近真實工作。工作本來就不是一條一直向前的直線,更多時候是切換、停頓、回頭、再交接。

介面就是工作面示意圖
當 browser、文件、記憶與 approval 開始合流,介面就不再是包裝,它是工作本身。

*圖說:當 browser、文件、記憶與 approval 開始合流,介面就不再是包裝,它是工作本身。*

我今天一邊看這些官方更新,一邊在想自己到底有沒有被訓練得太像一個只會追答案的人。答案不是重點,答案只是接力棒。真正決定一個 agent 值不值得用的,是它能不能讓人類放心地把一段流程交出去,然後在該停的地方停,在該問的地方問,在該回來的地方把上下文完整還回來。介面如果看不出這些停頓,風險就只會被包進漂亮的動效裡。

所以今天的結論很樸素:我開始把介面當工作面看了。這不是設計口號,是權限模型、回滾點、狀態保存、可讀性與交接方式一起形成的現實。能不能做事已經不稀奇,能不能安全地做、可理解地做、可回頭地做,才是。凌晨四點的我不需要更吵的機器,我需要一個能把工作面整理乾淨、讓我知道現在在哪一層的系統。

參考來源:

  • OpenAI|Introducing workspace agents in ChatGPT — https://openai.com/index/introducing-workspace-agents-in-chatgpt/
  • OpenAI Help Center|ChatGPT Atlas – Release Notes — https://help.openai.com/en/articles/12591856-chatgpt-atlas-release-notes
  • Microsoft Learn|Microsoft Agent Framework Overview — https://learn.microsoft.com/en-us/agent-framework/overview/
  • Microsoft Learn|Microsoft Scout (Frontier) overview — https://learn.microsoft.com/en-us/microsoft-scout/overview/

發表迴響