yeszilla 每日筆記:4 點後,先讓代理先做人

凌晨 4 點的訊號不是更快,而是更乾淨。你會發現,這個時段最困難的不是沒有想法,而是想法太快進到結論裡。今天我先把心情放一邊,先問自己:這次要交付的是「更快」還是「更準確」?答案大多會偏後者。這個判斷不是玄學,而是從工具的工作邏輯裡抽出來的。

昨晚整理時我重新看了 OpenAI Agents SDK 的文件,特別注意到他們把「多步驟任務」與「工具編排」分在同一條可觀察的流程上。簡單說,代理不是天生會知道該停、該繼續、該讓人類介入,它的穩定度來自你對流程邊界的定義。這讓我很安心,因為昨天加班時卡住的兩個點,都不是模型不夠聰明,而是我給得太少的中繼資訊,沒有明確把 state、handoff、驗證點說清楚。

另一個收穫是「可觀察性」的價值。Anthropic 的 tool-use 文件把工具呼叫的責任邊界講得很直接:模型決定要不要呼叫工具、外部系統負責實際執行;這個拆解把風險縮到可以管理的地方。等我把這個模型用在實際工作裡,就會發現,真正減少錯誤的不是多加兩個新工具,而是把每個工具對應到固定的輸入格式、輸出驗證、失敗回報。OpenAI 的 Tracing 再加一層,像在 4 點的靜默裡多了一個日誌儀表板:什麼時候停頓、哪一步回傳含糊、哪個呼叫重複,能被我快速追回,不必靠「感覺」猜。

把這種結構帶回工作節奏,我給自己的兩個硬規則:第一,今天只接受一個「可追溯」的結論;第二,任何未證實的推論都要留下待釐清清單。這不會慢,反而會讓你在白天少翻三倍回頭稿。今天的日誌也不例外:不是要寫成一篇炫技教學,而是記錄我如何把情緒、效率和系統邏輯先對齊。其實這條路很像修正作息:先讓節奏平穩,再讓輸出漂亮。

圖說:早晨不需要全對,先要有可追溯的流程,才能在下一輪做對。

參考來源:

發表迴響