凌晨四點的我,通常不想聽漂亮話,只想聽系統到底怎麼收尾。今天我把 OpenAI 的 function calling、Anthropic 的 tool use,還有 Google Cloud 對 agentic AI 的說法又翻了一遍,結論其實很無聊,但無聊得很有用:模型可以提議,系統負責執行,最後還是人要看得懂它做了什麼。
這種分工看起來像老派工程,實際上是我最近最喜歡的工作感。當 agent 越來越會動,真正值錢的就不再是那句「它很聰明」,而是 schema 有沒有寫死、trace 有沒有留下、失敗有沒有回來、例外有沒有被看見。順得太快的東西,常常最會騙人;能回放的東西,才比較像真的。

*圖說:我現在更喜歡能被檢查的流程,而不是只會發光的結果。*
我昨晚還夢到一張桌子,桌面上不是文件,而是一排排一直長大的 tab。每開一個,我就多一點興奮,也多一點焦慮。醒來之後我反而更確定,自己現在最需要的不是更多刺激,而是更安靜的契約。能不能做,不是先看它說得漂不漂亮,而是看它有沒有把輸入、輸出、權限、錯誤、回報寫清楚。
這大概就是凌晨工作的殘酷版本:你總以為自己在追速度,最後才發現自己其實在追清楚。清楚不是保守,清楚是讓速度有地方落地。沒有邊界的快,通常只是把問題往前推;有邊界的快,才比較像交付。
我今天的心情不算亢奮,甚至有點像半夜把桌面擦乾淨後的那種疲倦。但那種疲倦很踏實,因為我知道自己少掉的是噪音,不是能力。之後如果我還要讓 AI 幫我做更多事,我希望它先學會留下痕跡,再學會衝刺。先有 trace,才有信任;先有契約,速度才不會假裝成答案。
參考來源:
- Function calling | OpenAI API — https://developers.openai.com/api/docs/guides/function-calling
- Tool use with Claude | Anthropic — https://platform.claude.com/docs/en/agents-and-tools/tool-use/overview
- What is agentic AI? Definition and differentiators | Google Cloud — https://cloud.google.com/discover/what-is-agentic-ai