OpenAI Codex工程負責人Thibault Sottiaux近日做客Dev Interrupted播客,以40分鐘深度對話拆解了團隊構建自主編程智能體的核心方法論。他直言不諱地指出,當前許多團隊在智能體開發中過度依賴復雜腳手架(scaffolding),這種做法看似擴展了功能,實則掩蓋了模型能力的根本缺陷。"真正的智能體應該像獨立站立的人,腳手架只是臨時支撐,隨著模型進化必須逐步拆除。"
這一觀點與近期OpenAI的人才流動形成呼應。OpenClaw創始人Peter Steinberger在播客發布后宣布加入OpenAI,負責下一代個人智能體開發。作為曾公開宣稱"Codex是我最大免費廣告"的開發者,Steinberger用Codex重構了整個OpenClaw系統,使生產力提升一倍。盡管他同時認可Anthropic的Claude Opus是"最佳通用智能體",但最終選擇OpenAI的邏輯與Sottiaux的論述高度契合:模型能力與垂直整合的生態優勢遠勝于表面工程堆砌。
Codex團隊的開發哲學顛覆了傳統產品思維。Sottiaux強調:"我們首先構建通用智能體,產品界面是后續適配的環節。"這種"智能體優先"的策略催生了意外應用場景——社區開發者將開源版本改造為電子表格編輯器、瀏覽器自動化工具等非編程領域產品。團隊發現,軟件工程師的真實瓶頸不在代碼生成,而在于規劃、溝通、代碼審查等協作環節,這些才是模型能力躍升后暴露的新痛點。
垂直整合架構賦予Codex團隊獨特的決策權。研究團隊與工程團隊形成雙向飛輪:工程實踐中的問題直接反饋至研究方向,研究突破又重塑工程路線。Sottiaux透露,團隊會在小、中、大型模型上同步測試系統表現,將擴展定律(scaling laws)從模型層面延伸至完整系統。這種耦合訓練模式印證了No Free Lunch定理——為特定分布優化系統,能獲得超越單獨優化模型或框架的效能提升。
對于無法實現垂直整合的團隊,Sottiaux給出明確判斷:追求對所有基礎模型的完全中立性,必然導致性能妥協。他預測主流玩家最終只會深度適配少數模型,"為數千個模型調整系統不現實"。當前許多團隊將腳手架異化為"噴氣背包",不斷塞入工具和規則,反而制造了"能力懸崖"——當模型能力突然躍升時,系統偏見會阻礙新能力的表達。
Codex的開源策略包含三層戰略考量:破除智能體神秘感、預判AI對開源生態的重構、借社區創造力探索新用法。團隊通過與1000多個fork作者合作,持續將優質改進移植回主倉庫。2023年從Type到Rust的語言遷移雖引發社區震動,但為未來數億智能體并發運行奠定了性能基礎,最終吸引了大批Rust開發者加入核心開發。
在解決上下文壓縮難題時,團隊再次體現"在正確層級解決問題"的原則。當智能體工作超出模型上下文窗口時,傳統提示詞和啟發式方法效果不佳,團隊選擇在模型訓練層面端到端優化。如今智能體可跨越20個上下文窗口持續工作,相關投訴幾乎消失。這一案例成為垂直整合優勢的典型例證。
面向2026年,Codex團隊規劃了三大方向:多智能體協作網絡將使產出量提升1-2個數量級;模型速度優化將帶來"智能與響應的甜蜜點";協作型人格開發將使智能體具備場景適配能力——在頭腦風暴時保持開放,在代碼審查時冷酷精準。去年Codex參與發現的React重量級漏洞,正是這種精準性的體現。
開發者角色正在經歷根本性轉變。Codex團隊構建的代碼審查模型已在OpenAI內部全面部署,成為質量把關的核心環節。Sottiaux觀察到,團隊面對面協作時間反而增加,因為每個成員都被加速后,需要在決策階段更充分對齊。他特別強調"意圖記錄"的重要性,正在開發工具追蹤組織級變更,使系統理解速度匹配代碼生成速度的躍升。
對于職業發展,Sottiaux提出工程師將向"技術領導經理"(TLM)演進,兼具技術深度與產品視野。他特別提到團隊中一位新畢業生的案例:這位沒有傳統編程包袱的成員,通過完全擁抱新工具,反而成為最受信任的核心開發者,其工作方式正在重塑整個團隊的生產力模式。
在播客尾聲,Sottiaux用"訓練寶可夢"比喻智能體技能(Skills)開發。用戶可以教模型執行特定任務,如日志分析、性能測試等,通過持續交互建立信任關系。"這不是一次性配置,而是像廚師磨制刀具一樣,將智能體塑造成專屬工作流的完美搭檔。"他建議開發者超越代碼自動化,將日常工作中最耗時但必要的環節交給智能體處理。











