OpenAI 把模型上線前丟進真實對話沙盤,安全評測開始追求可預測 2026 年 6 月 18 日 作者: FishYes! OpenAI 的 Deployment Simulation 把模型發布前測試從靜態考卷推向部署預演:用去識別化的真實對話前綴重跑候選模型,先估出上線後可能出現的錯誤率。