從OpenAI離職不到一個月,被稱為“推理模型第一人”的Jerry Tworek已迅速投身創業浪潮。他創立的新公司Core Automation將目光聚焦于“持續學習”領域,并計劃籌集高達10億美元(約合人民幣70億元)的資金,試圖打造下一代具備動態學習能力的AI模型。
Jerry的學術背景與職業經歷為其創業奠定了堅實基礎。這位出生于波蘭的科學家在華沙大學獲得數學碩士學位后,曾赴阿姆斯特丹從事量化研究,專注于優化問題與噪聲數據處理。這段經歷讓他對“在不確定環境中決策”產生濃厚興趣,并逐漸轉向強化學習領域。2019年加入OpenAI后,他主導了首個推理模型o1的研發,并深度參與GPT-4、ChatGPT等核心項目的構建,成為推動大模型從“生成”向“推理”進化的關鍵人物。
此次創業,Jerry選擇挑戰OpenAI未完全解決的難題:如何讓模型擺脫“訓練即終點”的局限,實現持續學習。他指出,當前主流模型在部署后能力基本固化,難以適應真實世界中不斷變化的新場景。而Core Automation的目標是開發一種新型架構,使模型能像人類一樣,從新數據、新任務中動態吸收知識,同時保留已有技能。這一設想若實現,將顯著降低模型對海量靜態數據和算力的依賴,提升學習效率。
Jerry的計劃包含兩大技術突破:一是構建非Transformer架構,二是將訓練流程整合為連續系統。他希望通過這種設計,讓模型在運行過程中完成自我更新,而非依賴離線預訓練。盡管新公司尚未推出具體產品,但其理念已引發行業關注。部分網友認為,Core Automation可能比同期成立的SSI和Thinky Machines更具潛力,原因在于其直接切入AI發展的核心瓶頸——持續學習能力。
持續學習并非新概念,但近年來因成本與效率問題重新成為焦點。傳統大模型依賴海量數據預訓練,成本隨規模指數級增長。而持續學習模型可通過真實交互逐步進化,用更少的資源實現能力躍升。行業普遍認為,實現通用人工智能(AGI)需模型具備持續進化、處理長時序任務等能力,持續學習正是這一目標的前提。例如,Ilya創辦的SSI公司同樣聚焦該領域,其理念與Jerry高度契合——真正的AGI不應是靜態模型,而應能在真實世界中不斷積累經驗。
學術界與科技巨頭也已布局。谷歌去年提出“Nested Learning”與“Titans”架構,通過引入長期記憶模塊緩解遺忘問題;DeepMind研究員Ronak Malde更預言,2026年將成為持續學習元年。盡管挑戰巨大,但Jerry的創業仍被視為行業重要信號:當主流模型陷入同質化競爭時,動態學習能力或成為下一代AI的核心差異點。至于他能否籌得10億美元,答案或許取決于市場對“讓AI活到老、學到老”這一愿景的信心。









