滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

OpenAI o1架構師爆料：AI Scaling已到瓶頸，AGI需要會"自學"的模型

時間：2026-01-31 02:10:53 來源：硅星GenAI編輯：快訊 IP：北京 發表評論無障礙通道

Scaling還管用嗎？一個讓人不安的答案

Jerry Tworek的身份讓他的話格外有分量。作為OpenAI推理模型（o1、o3）和Codex的核心架構師，他親歷了從GPT-3到GPT-4、再到推理模型的整個技術演進。當被問到"預訓練和強化學習的scaling是否還有效"時，他給出了一個微妙的回答：

“這確實能讓我們走到某個地方……但問題是，這些模型能泛化嗎？”

他解釋道，當前的scaling邏輯非常直接：想讓模型在某個任務上表現更好？那就在這個任務上做更多強化學習訓練。想讓它理解更多世界知識？那就喂更多預訓練數據。這套方法在特定目標上確實奏效——你訓練什么，就得到什么。

但問題恰恰在這里：模型只會做你教它的事，卻不會舉一反三。

Jerry指出了一個被行業刻意忽視的瓶頸：大模型實驗室現在的工作流程是"發現模型哪里不行→針對性收集數據→重新訓練"。聽起來合理，但這個反饋循環慢得要命。每一輪迭代都需要幾周甚至幾個月，而更致命的是——你永遠無法窮盡所有可能的失敗場景。

“根本問題是：我們能否用更少的數據得到更好的結果？或者更本質地，讓模型學會從已學知識中更好地泛化？” 這個問題，到現在也沒人有答案。

AGI的關鍵：當模型"卡住"時會怎么辦

如果說scaling的局限還只是技術瓶頸，那Jerry對AGI的重新定義則是一次徹底的認知升級。

他坦言，自己曾經是個樂觀主義者：“我以前覺得，只要在模型上做強化學習，我們就能達到AGI……也許它已經是AGI了。” 但當他真正在日常工作中使用編程模型時，幻想破滅了：這些模型依然會犯錯，而且一旦失敗，它們就會變得"絕望"。

“我認為當今模型最大的局限是：當它們失敗時，你會很快感到無望——因為模型沒有任何機制去更新自己的信念和內部知識。”

他舉了個簡單的例子：當你讓AI幫你寫一段復雜代碼，它給出了一個方案但運行失敗了。人類程序員會怎么做？檢查錯誤信息、調整思路、嘗試另一個角度、搜索相關文檔、請教同事……直到問題解決。但現在的AI模型呢？它會再生成一個類似的錯誤答案，然后又一個，最終你不得不放棄或者自己動手。

“除非我們讓模型學會自己突破困境、自己解決卡殼的問題，否則我不會把它叫做AGI。”Jerry說，“真正的智能總能找到出路（Intelligence always finds a way），而當前的模型做不到這一點。”

這個觀點的顛覆性在于：它不是在爭論"模型需要多少參數"“訓練需要多少GPU”，而是在質疑整個技術路線的根基——靜態的、一次性訓練出來的模型，無論規模多大，都不可能真正"智能"，因為它們缺乏最基本的學習能力：從失敗中持續進化。

推理模型的秘密：你以為的"思考"其實只是更長的輸出

作為o1和o3的締造者之一，Jerry對"推理模型"這個概念有著異乎尋常的清醒認識。

當被問到"推理模型到底是什么"時，他給出了一個讓人意外的簡單答案：“本質上就是讓模型生成更多token。” 這聽起來有點反高潮，但他解釋得很透徹：

人類在解決復雜問題時，不會一口氣給出答案，而是會在腦子里反復推演、試錯、修正。推理模型模仿的就是這個過程——通過生成更長的"思維鏈"（chain of thought），讓模型在給出最終答案前有更多"思考空間"。

但這里有個巨大的成本問題：生成token需要錢。如果一個任務本來只需要50個token就能回答，現在為了"推理"要生成5000個token，成本直接翻了100倍。這就是為什么推理模型會專門標注"推理時間"和"輸出token數"——用戶需要在質量和成本之間做權衡。

Jerry透露了一個行業共識：當你真的需要高質量答案時（比如寫關鍵代碼、分析復雜合同、設計系統架構），多花10倍甚至100倍成本讓模型"深度思考"是值得的。但對于簡單查詢（比如"今天天氣怎么樣"），就完全沒必要。

這也解釋了為什么OpenAI、Anthropic、Google都在同時維護"快速模型"和"推理模型"兩條產品線——不同任務需要不同的"思考深度"，而這直接對應著不同的成本結構。

數據困境：當全世界的文本都不夠用了

如果你以為"數據瓶頸"只是個理論問題，Jerry會告訴你——這已經是實打實的現實危機。

"我們已經把互聯網上能抓的高質量文本基本都用完了，"他說得很直白，“現在的問題是：下一批訓練數據從哪來？”

目前行業的主流方案是"合成數據"——讓AI生成數據來訓練AI。聽起來像個完美的閉環，但Jerry指出了致命缺陷：你無法讓模型教會自己它不知道的東西。如果模型從來沒見過某類推理模式、某種編程技巧、某個科學概念，那它生成的"合成數據"里也不會有這些內容。

更麻煩的是，合成數據可能帶來"模型近親繁殖"——AI生成的數據訓練出來的AI，會越來越像原來的AI，逐漸失去多樣性和創造力。就像一個只看自己寫的文章的作家，最終會陷入思維定式。

那出路在哪？Jerry提到了一個方向：讓模型去解決真實世界的問題，把成功和失敗的經驗作為新數據。比如讓編程模型去修實際的bug、讓科學模型去驗證真實的假設。這種"在實戰中學習"的模式，可能是突破數據瓶頸的關鍵。

但這又回到了前面的問題：如果模型"卡住"了，它會自己想辦法突破嗎？還是會一直重復同樣的錯誤？

實驗室還是創業公司？一個關于選擇的坦誠建議

訪談的后半段，Jerry聊到了一個很多AI從業者都在糾結的問題：該去大實驗室還是創業公司？

他的回答出人意料地務實：“如果你早上醒來，發現自己不再熱愛現在的工作，那就是個信號——該換方向了。”

這不是心靈雞湯，而是基于殘酷現實的建議。Jerry強調，作為研究者，如果你對工作沒有100%的熱情，就不可能做出最好的成果。AI領域的競爭已經白熱化到什么程度？當你帶著"還行吧"的心態在實驗室磨洋工時，隔壁桌的同事可能正在通宵調試下一個突破性模型。

他還分享了團隊建設的心得：“最好組建一個有共同價值觀、共同方法論的團隊。” 這聽起來很基礎，但Jerry指出，很多實驗室在招人時貪圖"全能型人才"，結果拼湊出一個理念不合、目標沖突的團隊，反而效率低下。

"目標一致的團隊行動更快，"他說，“與其試圖討好所有人,不如雙向篩選，找到真正契合的人。”

關于"什么樣的人能成為優秀AI研究者"，Jerry給出了三個標準：

既懂系統工程，又懂理論——只會寫論文或只會調參數都不夠

敢于提出反主流觀點——當所有人都在做A時，你要有勇氣去試B

愿意追求未經證實的高風險方向——真正的突破往往來自"大家都覺得不太可能"的想法

最后這一點尤其關鍵。Jerry提到，OpenAI內部有大量項目最終被證明是"死胡同"，但正是因為有人敢于嘗試這些看似瘋狂的方向，才偶爾能碰到o1這樣的突破。

職業建議的弦外之音：管理者的核心能力是什么

當被問到"如何成為好的研究管理者"時，Jerry的回答讓人印象深刻：

“最重要的技能是強大的人員管理能力——深入理解團隊的工作，然后賦予他們自主權和主人翁意識。”

這句話看似簡單，背后卻是對"微觀管理"的徹底否定。很多技術出身的管理者習慣于事無巨細地指導下屬"應該怎么做"，但Jerry認為，真正優秀的管理者應該做的是：確保團隊成員熱愛自己的課題，然后放手讓他們去探索。

他還提到了一個有趣的觀察：很多人在同一個崗位上待久了，會逐漸失去激情。"這時候最糟糕的選擇是硬撐，"Jerry說，“承認自己需要改變，然后主動去尋找新方向，這不是失敗，而是成熟。”

這個建議對很多在大廠感到疲憊的AI工程師來說，可能是個及時的提醒。

機器人的春天：兩三年內就會來

訪談接近尾聲時，Jerry聊到了一個讓人意外的預測：具身智能（機器人）會在2-3年內實現實用化。

這個判斷基于一個簡單的邏輯：編程任務已經被AI攻克到了相當高的水平，而機器人的核心難題——運動規劃、視覺識別、任務分解——本質上都是"在物理世界里的編程問題"。既然代碼世界的問題能用強化學習解決，物理世界的問題為什么不行？

當然，他也承認機器人面臨獨特的挑戰：試錯成本高得多。在代碼世界里，模型可以每秒嘗試成千上萬次，失敗了大不了重來；但在物理世界里，讓機器人"學習"抓取一個杯子，可能需要幾千次真實的嘗試，每次都要耗費時間、電力、機械磨損，甚至可能摔壞設備。

但Jerry認為，隨著模擬器技術的進步和遷移學習能力的提升，這個問題正在被快速解決。“我預計在未來兩三年內，我們會看到機器人在特定領域（比如倉庫分揀、家庭清潔）達到實用水平。”

這個時間線比大多數人想象的要激進得多。

尾聲：一個關于"不完美智能"的未來

整場訪談最打動人的，不是那些關于技術細節的討論，而是Jerry對AI本質的清醒認識。

他從不聲稱"我們快要實現AGI了"，也不販賣"AI將改變一切"的焦慮。相反，他反復強調的是當前技術的局限、未解決的難題、以及那些被行業集體忽視的根本性問題。

當他說"除非模型學會從失敗中持續學習，否則我不會稱其為AGI"時，你能感覺到這不是技術術語的咬文嚼字，而是一個親手打造過最強推理模型的工程師，在直面自己作品局限時的誠實。

這種誠實在當下的AI圈子里異常稀缺。當大多數公司都在宣傳"我們的模型多么強大"時，Jerry在說"模型會卡住，而且它們不知道怎么自救"。當投資人都在問"什么時候能盈利"時,他在說"我們連下一批訓練數據從哪來都不確定"。

但也正是這種坦誠,讓他的建議格外有價值。無論你是在大廠做研究、在創業公司調模型，還是在觀望要不要轉行AI——Jerry的訪談都在提醒你：

這個行業遠沒有表面看起來那么確定。真正的機會不在于跟風"堆算力"“卷參數”，而在于找到那些被主流忽視的根本性問題，然后有勇氣去啃這塊硬骨頭。

更多>同類資訊

70歲萌新報道！成龍正式入駐小紅書

01-31

消息稱小紅書內測語音問一問功能

01-31

百度「崩了」，頁面顯示不存在

01-31

中興通訊與京東簽署戰略合作協議，三年目標銷售額破百億元

01-31

警惕“裸奔”的開源AI：研究稱脫離監管或成黑客劫持溫床

01-31

小紅書內測“語音問一問”：真人經驗+AI，打造社區搜索新樣態

01-31

完美世界2025年業績飄紅：游戲影視齊發力歸母凈利潤超7億

01-31

馬斯克擬整合資產推進太空算力布局或借旗下公司優勢實現設想

01-31

梁汝波明確字節2026“勇攀高峰”方向，五項舉措全力沖刺AI賽道

近日，字節跳動召開2026年首次全員會議，CEO梁汝波在會上公開公司年度OKR，將年度關鍵詞定為“勇攀高峰”，并圍繞AI時代機遇部署核心戰略。本次全員會議反映出字節對AI助手賽道的全力投入，將大幅加速“A…

01-31

千問開源模型突破400+領跑全球中國開源AI下載量首超美國彰顯實力

截至目前，千問模型累計下載量突破10億次，衍生模型超20萬個，構建起全球規模最大的開源模型生態。業內預測，在技術創新與生態紅利加持下，國產開源模型將在智能體、多模態交互等下一代AI場景中持續領跑，進一步鞏固全…

01-31

阿里云與ZStack攜手：打造“云邊一體”生態，賦能企業數智化轉型新路徑

針對這一痛點，新方案構建了分層架構：在地市級節點部署ZStack邊緣平臺，實現圖片實時回傳時延小于15ms，并支持數據在本地存儲3至6個月，承擔初步分析任務；而在網省側部署阿里云中心云，匯聚關鍵數據進行AI…

01-31

小紅書游戲峰會：以「種草用增」重構長效增長，解鎖游戲行業新機遇

本次峰會系統梳理了以「種草用增」為核心的增長新范式：從數據驅動的玩家洞察出發，依托繁榮社區生態培育優質內容，并通過貫通“內容種草”與“下載轉化”的產品化鏈路，實現高質量用戶增長。小紅書持續完善并開放這套以…

01-31

螞蟻靈波四天連發開源四大模型谷歌緊隨開放體驗世界模型競爭轉向開放協同

承接前幾日開源發布的 LingBot-World（模擬環境）、LingBot-VLA（智能基座）與LingBot-Depth（空間感知），LingBot-VA 探索出一條“世界模型賦能具身操作”的全新路徑。…

01-31

北京經貿職業學院25級AI學子走進科大訊飛觸摸AI前沿激發學習熱情

為落實五年制高職認識實習教學要求，幫助新生直觀感受人工智能技術的發展魅力與產業應用場景，1月8日上午，北京經貿職業學院25級人工智能技術應用專業27名學生赴科大訊飛北京總部開展認識實習活動，讓師生們近距離觸摸…

01-31

蘋果財報會議確認：集成Gemini的Siri將依托私有云計算架構運行

投資者和分析師的提問主要集中在蘋果如何通過AppleIntelligence實現商業化，以及這項被庫克多次稱為"合作"的技術和商業層面的具體細節。Q1：蘋果與谷歌的Gemini合作中，模型會在哪里運行？ …

01-31

點擊查看更多 +

全站最新

Waymo自動駕駛撞倒小學生引關注美國展開多項安全調查

新疆富蘊縣雪豹再惹事：咬傷游客后又咬死35只羊！野外遇險如何應對？

營收銷量雙突破：長城汽車以長期主義筑牢根基，開啟增長新篇章

聚焦自動駕駛新突破！“智驅新程?芯動未來”超級汽車論壇共話未來

寶馬大中華區換帥：柯睿辰接棒，以銷售強執行力應對中國市場新挑戰

2025全球純電車銷量將破1210萬！比亞迪登頂，氫能、AI云等領域迎新突破

熱門內容

本欄最新

Waymo自動駕駛撞倒小學生引關注美國展開多項安全調查

新疆富蘊縣雪豹再惹事：咬傷游客后又咬死35只羊！野外遇險如何應對？

寶馬大中華區換帥：柯睿辰接棒，以銷售強執行力應對中國市場新挑戰

2025全球純電車銷量將破1210萬！比亞迪登頂，氫能、AI云等領域迎新突破

2026中英企業家委員會會議舉行雷軍透露小米計劃四年內在英開150家店

宇樹機器狗成全球銷冠，王興興揭秘：先發優勢與成本把控成制勝關鍵

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

OpenAI o1架構師爆料：AI Scaling已到瓶頸，AGI需要會"自學"的模型