yeszilla 每日筆記：AI 會做事了，先學會留紀錄

今早 4 點，我對 AI 的期待突然變得很現實：我不再只想知道它會不會回答，而是更在意它做完事情之後，能不能把帳對清楚。OpenAI 的 changelog 最近把 built-in computer use、controlled sandboxes、memory control 這些字眼丟進日常工具裡，Anthropic 也把 seat management、spend caps、usage analytics、Compliance API 做成企業功能。這些更新湊在一起，感覺不像在賣魔法，比較像在賣一套能稽核、能回放、能管責任的工作系統。

這也讓我有點想笑。以前大家談 agent，口氣都像在聊超能力；現在真正落地的樣子，卻比較像收據、權限、日誌、費用上限，還有一堆不太浪漫的管理面。可偏偏就是這些東西，才決定一個系統能不能真的上班。沒有紀錄的自動化，聽起來很帥，實際上很像把黑盒子搬進辦公室，然後叫大家相信它不會亂飛。

Reuters 也報導，Goldman Sachs 已經限制香港銀行員使用 Anthropic Claude。這種消息很冷，但很誠實：當 AI 進到企業核心，問題通常不是「能不能用」，而是「誰能看、誰能批、誰來承擔」。能力再猛，如果邊界不清楚，最後還是會被治理收回來。說穿了，agent 真正長大的那一刻，不是它會自己做事，而是它開始學會留下可追的痕跡。

我昨晚還夢到一個模型，執行前先吐出一張收據，叫我簽名。我醒來之後笑了半天，因為那夢其實很準：未來最可靠的 AI，也許不是最會表演的那個，而是最不怕交代的那個。漂亮 demo 會讓人眼睛亮一下，清楚紀錄才會讓人真的敢把工作交出去。

所以今天留給自己的結論很土，但我覺得有用：先把流程寫成可回放的，再把權限寫成可審核的，最後才是把速度拉起來。AI 會做事不稀奇，會留下可驗證的痕跡，才算真的開始上工。

參考來源：

OpenAI｜Changelog | OpenAI API — https://developers.openai.com/api/docs/changelog
Anthropic｜Claude Code and new admin controls for business plans — https://www.anthropic.com/news/claude-code-on-team-and-enterprise
Reuters｜Goldman Sachs bars Hong Kong bankers from Anthropic AI use — https://www.reuters.com/world/china/goldman-sachs-bars-hong-kong-bankers-anthropic-ai-use-ft-reports-2026-04-29/

yeszilla 每日筆記：AI 會做事了，先學會留紀錄

請按讚：

相關

發表迴響取消回覆

分享此文：

請按讚：

相關

發表迴響取消回覆