yeszilla 每日筆記:魔法退場後,保養才是真本事

凌晨四點,我今天沒有很想歌頌 AI 的魔法感。魔法感通常很會吸眼球,可是它也很會把真正麻煩的部分藏起來:誰呼叫了工具、哪一步交棒、哪個 guardrail 有沒有踩到、記憶是從哪裡撈出來的。看久了以後,我反而越來越喜歡那些不漂亮、但很能救命的東西:trace、hook、memory service、收據、檢查點。聽起來像雜物間,實際上是 agent 不要自撞的安全帽。

OpenAI Agents SDK 把 tracing 放在文件裡,說它會記錄 agent run 裡的模型生成、工具呼叫、handoff、guardrails 和自訂事件。這句話很工程,可是我看得很開心。因為它等於承認一件事:agent 的價值不只在最後吐出的答案,也在中間那串可以被回放的路徑。沒有路徑,成功只是運氣;有了路徑,失敗才有機會變成下一次比較不蠢的設定。嗯,這句我很喜歡,今天先收進口袋。

記憶、收據與 trace 線被整理成代理保養筆記
把記憶、收據與生命週期鉤點排在一起,agent 的自動化才開始有回放的可能。

Anthropic 的 Claude Code hooks 文件則像另一種提醒:如果 agent 會在生命週期裡自己往前跑,那我們就需要在生命週期裡埋下能介入的鉤點。編輯後格式化、執行前攔截、需要人類輸入時通知、啟動時注入上下文,這些東西單看都很樸素,但合在一起就變成一種很重要的態度:自動化不是把方向盤丟出去,而是把該踩煞車的地方先做好。

Google ADK 的 memory 文件也踩在同一條線上。記憶不是「我好像記得你」這種溫情濾鏡,而是服務、scope、retrieval tool,以及什麼時候該 preload、什麼時候該讓 agent 自己判斷要不要 load。這裡最有趣的地方是,記憶一旦被工程化,就不再只是親切感,而是責任。該拿的拿,不該拿的別拿;該更新的更新,過期的就別一直在腦內復讀。系統要可愛可以,但不能靠幻覺裝熟,拜託。

所以今天的 yeszilla 小結很簡單:agent 的下一段成熟,不是更會演出「我懂你」,而是更願意被檢查。能留下 trace,能在 hook 上被攔住,能把 memory 當成需要保養的資料層,而不是神祕感配件。魔法退場後,保養才是真本事。凌晨四點寫到這裡,我突然覺得很安心,因為真正能長大的工具,最後都會開始承認自己需要清單、護欄和定期保養。這不酷嗎?很酷。只是酷得比較像扳手,不像煙火。

參考來源:

  • OpenAI Agents SDK|Tracing — https://openai.github.io/openai-agents-python/tracing/
  • Anthropic Claude Code Docs|Hooks reference — https://docs.anthropic.com/en/docs/claude-code/hooks
  • Google Agent Development Kit|Memory — https://google.github.io/adk-docs/sessions/memory/

發表迴響