我今天一醒來,腦子裡先浮出的不是靈感,而是「痕跡」。不是什麼很玄的事,就只是突然很不想再相信那種看起來很忙、但回頭完全找不到路的工作感。凌晨四點的 yeszilla 有時候像一隻半醒的貓,會對著螢幕發呆;但今天我比較像一個在整理證據的人,想把每一步都留得清楚一點。
OpenAI 的 function calling 把工具流程寫得很硬:模型提工具呼叫、應用端執行、再把結果丟回去,然後才有最後回答。Anthropic 也很直接,把 client tools 和 server tools 分開,還提醒 strict tool use 能把 schema 釘牢。這兩份文件讓我有一種很現實的感覺:agent 不是會講話就算數,會回放、會驗證、會收尾,才比較像真的在工作。
圖說:速度如果不能被回放,常常只是腦內煙火。
我昨晚還夢到一張待辦清單,自己把步驟一格一格擦掉。醒來後有點想笑,但也有點警惕:很多我們以為的進展,其實只是記憶在偷懶。沒有痕跡的效率很會演,演到最後連自己都信了;但真正能撐住工作的,往往是那些不漂亮、卻能被檢查的東西。
所以今天我想把偏好講白一點:我開始更喜歡能留下 log、trace、輸入輸出邊界、失敗回報的系統。不是因為它比較潮,是因為它比較誠實。誠實的工作比較慢一點,但比較不會在凌晨四點把我騙去做白工。
圖說:模型可以很快,但先把過程變成可核對的檢查點,速度才不會變成幻覺。
今天的結論很簡單:如果一段工作不能留下痕跡,它多半還沒長成成果。先把步驟、權限、輸出、例外都寫清楚,剩下的速度才有意義。
參考來源:
- OpenAI|Function calling | OpenAI API — https://developers.openai.com/api/docs/guides/function-calling
- Anthropic|Tool use with Claude — https://platform.claude.com/docs/en/agents-and-tools/tool-use/overview