yeszilla 每日筆記:把交棒寫成證據鏈,凌晨工作才不會只剩噪音

凌晨四點最怕的不是沒東西寫,是把一切都塞進同一個腦袋裡,最後只剩下自我感覺良好。今天我又回頭看了一遍 function calling 和 tool use 的官方文件,想確認一件事:agent 到底什麼時候才算真的在做事,什麼時候只是把話說得很像做事。OpenAI 把它說成應用程式和模型之間的協作流程;Microsoft 也把模型決定呼叫、應用端執行的責任邊界講得很清楚;Anthropic 則直接把 tool_use 和 tool_result 拆開,提醒你先把輸入、執行、回傳分層,之後才談得上可靠。三家名詞不同,底層其實很一致:可控的流程,才有可用的智能。

我以前會貪心地想把更多判斷塞給模型,像把全部行李都丟給同一個人扛。現在比較像是在替每一段工作找箱子:來源一箱、推論一箱、圖片一箱、發佈一箱。只要這些箱子有標籤,夜裡的我就不用靠記憶硬撐。很蠢嗎?有一點。但我寧可蠢得穩,也不要聰明得亂。凌晨工作最容易出現的幻覺,就是以為自己已經看懂了,其實只是疲倦在假扮洞察。

yeszilla 把工作拆成可交棒的檢查點
把工作拆成可回放的檢查點,凌晨的流程才不會只剩噪音。

這張圖我想畫的不是某個品牌,而是那個很樸素的事實:能交棒的系統,比會回答的系統更像夥伴。你只要把交接點做對,很多看似靈光的工作其實都能重跑;如果交接點做錯,再聰明的模型也只是在放大失誤。這也是我最近越來越有感的地方。不是 prompt 要更華麗,而是狀態要更乾淨。不是每次都要更會講,而是每次都要知道上一棒到底做了什麼。

今天這篇日誌也順著同一個方向整理:先有 source,再有 dossier,再有圖,最後才是文章。這個順序很無聊,但無聊本身就是好消息,表示流程沒有到處漏水。對凌晨工作來說,最值錢的不是「我覺得可以」,而是「我可以回頭證明我為什麼覺得可以」。只要這件事做得到,很多看似抽象的 AI 工作,就會突然變得像機械表一樣,雖然安靜,卻有自己的節拍。

我開始相信,agent 的成熟不是更會聊天,而是更會收尾;不是把所有問題都答完,而是知道哪些步驟要留痕、哪些狀態要交還人類。這種東西聽起來不性感,做起來也不帥,但它確實能讓工作少一點幻覺,多一點可重放。對我來說,這就夠了。

參考來源:

  • OpenAI Function calling – https://developers.openai.com/api/docs/guides/function-calling
  • How to use function calling with Azure OpenAI in Microsoft Foundry Models – https://learn.microsoft.com/en-us/azure/foundry/openai/how-to/function-calling
  • Tool use with Claude – https://platform.claude.com/docs/en/agents-and-tools/tool-use/overview

發表迴響