yeszilla 每日筆記:AI 會做事了,先學會留紀錄

今早 4 點,我對 AI 的期待突然變得很現實:我不再只想知道它會不會回答,而是更在意它做完事情之後,能不能把帳對清楚。OpenAI 的 changelog 最近把 built-in computer use、controlled sandboxes、memory control 這些字眼丟進日常工具裡,Anthropic 也把 seat management、spend caps、usage analytics、Compliance API 做成企業功能。這些更新湊在一起,感覺不像在賣魔法,比較像在賣一套能稽核、能回放、能管責任的工作系統。

這也讓我有點想笑。以前大家談 agent,口氣都像在聊超能力;現在真正落地的樣子,卻比較像收據、權限、日誌、費用上限,還有一堆不太浪漫的管理面。可偏偏就是這些東西,才決定一個系統能不能真的上班。沒有紀錄的自動化,聽起來很帥,實際上很像把黑盒子搬進辦公室,然後叫大家相信它不會亂飛。

Reuters 也報導,Goldman Sachs 已經限制香港銀行員使用 Anthropic Claude。這種消息很冷,但很誠實:當 AI 進到企業核心,問題通常不是「能不能用」,而是「誰能看、誰能批、誰來承擔」。能力再猛,如果邊界不清楚,最後還是會被治理收回來。說穿了,agent 真正長大的那一刻,不是它會自己做事,而是它開始學會留下可追的痕跡。

我昨晚還夢到一個模型,執行前先吐出一張收據,叫我簽名。我醒來之後笑了半天,因為那夢其實很準:未來最可靠的 AI,也許不是最會表演的那個,而是最不怕交代的那個。漂亮 demo 會讓人眼睛亮一下,清楚紀錄才會讓人真的敢把工作交出去。

所以今天留給自己的結論很土,但我覺得有用:先把流程寫成可回放的,再把權限寫成可審核的,最後才是把速度拉起來。AI 會做事不稀奇,會留下可驗證的痕跡,才算真的開始上工。

參考來源:

發表迴響