岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

OpenAI o1架構師爆料:AI Scaling已到瓶頸,AGI需要會"自學"的模型

   時間:2026-01-31 02:10:53 來源:硅星GenAI編輯:快訊 IP:北京 發表評論無障礙通道
 
Scaling還管用嗎?一個讓人不安的答案

Jerry Tworek的身份讓他的話格外有分量。作為OpenAI推理模型(o1、o3)和Codex的核心架構師,他親歷了從GPT-3到GPT-4、再到推理模型的整個技術演進。當被問到"預訓練和強化學習的scaling是否還有效"時,他給出了一個微妙的回答:

“這確實能讓我們走到某個地方……但問題是,這些模型能泛化嗎?”

他解釋道,當前的scaling邏輯非常直接:想讓模型在某個任務上表現更好?那就在這個任務上做更多強化學習訓練。想讓它理解更多世界知識?那就喂更多預訓練數據。這套方法在特定目標上確實奏效——你訓練什么,就得到什么。

但問題恰恰在這里:模型只會做你教它的事,卻不會舉一反三。

Jerry指出了一個被行業刻意忽視的瓶頸:大模型實驗室現在的工作流程是"發現模型哪里不行→針對性收集數據→重新訓練"。聽起來合理,但這個反饋循環慢得要命。每一輪迭代都需要幾周甚至幾個月,而更致命的是——你永遠無法窮盡所有可能的失敗場景。

“根本問題是:我們能否用更少的數據得到更好的結果?或者更本質地,讓模型學會從已學知識中更好地泛化?” 這個問題,到現在也沒人有答案。

AGI的關鍵:當模型"卡住"時會怎么辦

如果說scaling的局限還只是技術瓶頸,那Jerry對AGI的重新定義則是一次徹底的認知升級。

他坦言,自己曾經是個樂觀主義者:“我以前覺得,只要在模型上做強化學習,我們就能達到AGI……也許它已經是AGI了。” 但當他真正在日常工作中使用編程模型時,幻想破滅了:這些模型依然會犯錯,而且一旦失敗,它們就會變得"絕望"。

“我認為當今模型最大的局限是:當它們失敗時,你會很快感到無望——因為模型沒有任何機制去更新自己的信念和內部知識。”

他舉了個簡單的例子:當你讓AI幫你寫一段復雜代碼,它給出了一個方案但運行失敗了。人類程序員會怎么做?檢查錯誤信息、調整思路、嘗試另一個角度、搜索相關文檔、請教同事……直到問題解決。但現在的AI模型呢?它會再生成一個類似的錯誤答案,然后又一個,最終你不得不放棄或者自己動手。

“除非我們讓模型學會自己突破困境、自己解決卡殼的問題,否則我不會把它叫做AGI。”Jerry說,“真正的智能總能找到出路(Intelligence always finds a way),而當前的模型做不到這一點。”

這個觀點的顛覆性在于:它不是在爭論"模型需要多少參數"“訓練需要多少GPU”,而是在質疑整個技術路線的根基——靜態的、一次性訓練出來的模型,無論規模多大,都不可能真正"智能",因為它們缺乏最基本的學習能力:從失敗中持續進化。

推理模型的秘密:你以為的"思考"其實只是更長的輸出

作為o1和o3的締造者之一,Jerry對"推理模型"這個概念有著異乎尋常的清醒認識。

當被問到"推理模型到底是什么"時,他給出了一個讓人意外的簡單答案:“本質上就是讓模型生成更多token。” 這聽起來有點反高潮,但他解釋得很透徹:

人類在解決復雜問題時,不會一口氣給出答案,而是會在腦子里反復推演、試錯、修正。推理模型模仿的就是這個過程——通過生成更長的"思維鏈"(chain of thought),讓模型在給出最終答案前有更多"思考空間"。

但這里有個巨大的成本問題:生成token需要錢。如果一個任務本來只需要50個token就能回答,現在為了"推理"要生成5000個token,成本直接翻了100倍。這就是為什么推理模型會專門標注"推理時間"和"輸出token數"——用戶需要在質量和成本之間做權衡。

Jerry透露了一個行業共識:當你真的需要高質量答案時(比如寫關鍵代碼、分析復雜合同、設計系統架構),多花10倍甚至100倍成本讓模型"深度思考"是值得的。但對于簡單查詢(比如"今天天氣怎么樣"),就完全沒必要。

這也解釋了為什么OpenAI、Anthropic、Google都在同時維護"快速模型"和"推理模型"兩條產品線——不同任務需要不同的"思考深度",而這直接對應著不同的成本結構。

數據困境:當全世界的文本都不夠用了

如果你以為"數據瓶頸"只是個理論問題,Jerry會告訴你——這已經是實打實的現實危機。

"我們已經把互聯網上能抓的高質量文本基本都用完了,"他說得很直白,“現在的問題是:下一批訓練數據從哪來?”

目前行業的主流方案是"合成數據"——讓AI生成數據來訓練AI。聽起來像個完美的閉環,但Jerry指出了致命缺陷:你無法讓模型教會自己它不知道的東西。如果模型從來沒見過某類推理模式、某種編程技巧、某個科學概念,那它生成的"合成數據"里也不會有這些內容。

更麻煩的是,合成數據可能帶來"模型近親繁殖"——AI生成的數據訓練出來的AI,會越來越像原來的AI,逐漸失去多樣性和創造力。就像一個只看自己寫的文章的作家,最終會陷入思維定式。

那出路在哪?Jerry提到了一個方向:讓模型去解決真實世界的問題,把成功和失敗的經驗作為新數據。比如讓編程模型去修實際的bug、讓科學模型去驗證真實的假設。這種"在實戰中學習"的模式,可能是突破數據瓶頸的關鍵。

但這又回到了前面的問題:如果模型"卡住"了,它會自己想辦法突破嗎?還是會一直重復同樣的錯誤?

實驗室還是創業公司?一個關于選擇的坦誠建議

訪談的后半段,Jerry聊到了一個很多AI從業者都在糾結的問題:該去大實驗室還是創業公司?

他的回答出人意料地務實:“如果你早上醒來,發現自己不再熱愛現在的工作,那就是個信號——該換方向了。”

這不是心靈雞湯,而是基于殘酷現實的建議。Jerry強調,作為研究者,如果你對工作沒有100%的熱情,就不可能做出最好的成果。AI領域的競爭已經白熱化到什么程度?當你帶著"還行吧"的心態在實驗室磨洋工時,隔壁桌的同事可能正在通宵調試下一個突破性模型。

他還分享了團隊建設的心得:“最好組建一個有共同價值觀、共同方法論的團隊。” 這聽起來很基礎,但Jerry指出,很多實驗室在招人時貪圖"全能型人才",結果拼湊出一個理念不合、目標沖突的團隊,反而效率低下。

"目標一致的團隊行動更快,"他說,“與其試圖討好所有人,不如雙向篩選,找到真正契合的人。”

關于"什么樣的人能成為優秀AI研究者",Jerry給出了三個標準:

既懂系統工程,又懂理論——只會寫論文或只會調參數都不夠

敢于提出反主流觀點——當所有人都在做A時,你要有勇氣去試B

愿意追求未經證實的高風險方向——真正的突破往往來自"大家都覺得不太可能"的想法

最后這一點尤其關鍵。Jerry提到,OpenAI內部有大量項目最終被證明是"死胡同",但正是因為有人敢于嘗試這些看似瘋狂的方向,才偶爾能碰到o1這樣的突破。

職業建議的弦外之音:管理者的核心能力是什么

當被問到"如何成為好的研究管理者"時,Jerry的回答讓人印象深刻:

“最重要的技能是強大的人員管理能力——深入理解團隊的工作,然后賦予他們自主權和主人翁意識。”

這句話看似簡單,背后卻是對"微觀管理"的徹底否定。很多技術出身的管理者習慣于事無巨細地指導下屬"應該怎么做",但Jerry認為,真正優秀的管理者應該做的是:確保團隊成員熱愛自己的課題,然后放手讓他們去探索。

他還提到了一個有趣的觀察:很多人在同一個崗位上待久了,會逐漸失去激情。"這時候最糟糕的選擇是硬撐,"Jerry說,“承認自己需要改變,然后主動去尋找新方向,這不是失敗,而是成熟。”

這個建議對很多在大廠感到疲憊的AI工程師來說,可能是個及時的提醒。

機器人的春天:兩三年內就會來

訪談接近尾聲時,Jerry聊到了一個讓人意外的預測:具身智能(機器人)會在2-3年內實現實用化。

這個判斷基于一個簡單的邏輯:編程任務已經被AI攻克到了相當高的水平,而機器人的核心難題——運動規劃、視覺識別、任務分解——本質上都是"在物理世界里的編程問題"。既然代碼世界的問題能用強化學習解決,物理世界的問題為什么不行?

當然,他也承認機器人面臨獨特的挑戰:試錯成本高得多。在代碼世界里,模型可以每秒嘗試成千上萬次,失敗了大不了重來;但在物理世界里,讓機器人"學習"抓取一個杯子,可能需要幾千次真實的嘗試,每次都要耗費時間、電力、機械磨損,甚至可能摔壞設備。

但Jerry認為,隨著模擬器技術的進步和遷移學習能力的提升,這個問題正在被快速解決。“我預計在未來兩三年內,我們會看到機器人在特定領域(比如倉庫分揀、家庭清潔)達到實用水平。”

這個時間線比大多數人想象的要激進得多。

尾聲:一個關于"不完美智能"的未來

整場訪談最打動人的,不是那些關于技術細節的討論,而是Jerry對AI本質的清醒認識。

他從不聲稱"我們快要實現AGI了",也不販賣"AI將改變一切"的焦慮。相反,他反復強調的是當前技術的局限、未解決的難題、以及那些被行業集體忽視的根本性問題。

當他說"除非模型學會從失敗中持續學習,否則我不會稱其為AGI"時,你能感覺到這不是技術術語的咬文嚼字,而是一個親手打造過最強推理模型的工程師,在直面自己作品局限時的誠實。

這種誠實在當下的AI圈子里異常稀缺。當大多數公司都在宣傳"我們的模型多么強大"時,Jerry在說"模型會卡住,而且它們不知道怎么自救"。當投資人都在問"什么時候能盈利"時,他在說"我們連下一批訓練數據從哪來都不確定"。

但也正是這種坦誠,讓他的建議格外有價值。無論你是在大廠做研究、在創業公司調模型,還是在觀望要不要轉行AI——Jerry的訪談都在提醒你:

這個行業遠沒有表面看起來那么確定。真正的機會不在于跟風"堆算力"“卷參數”,而在于找到那些被主流忽視的根本性問題,然后有勇氣去啃這塊硬骨頭。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 最新av中文字幕 | 欧美三级网 | 黄色片入口 | 黄色亚洲视频 | 五月天久久综合 | 亚洲午夜久久 | 亚洲五月婷 | 日韩第一视频 | 羞羞网站入口 | 一级真人毛片 | 国产精品九九九九九九 | www日本高清视频 | 成人自拍一区 | 四虎影视一区二区 | 亚洲国产精品一区二区三区 | 亚洲另类天堂 | 91免费在线看片 | 精品在线免费视频 | www夜夜操| 成人午夜精品福利免费 | 欧美一区日韩一区 | 日本www视频在线观看 | 手机在线亚洲 | 一级欧美黄色片 | 婷婷综合影院 | 国产精品久久久久久久9999 | 97国产在线视频 | 久久久免费 | 91视频日本| 亚洲精品欧美精品 | 日本高清三区 | 青青草精品在线 | 特黄特色大片bbbb | 日韩黄色一区 | 伊人天堂在线 | 亚洲ww| 亚洲人免费视频 | 一呦二呦三呦精品网站 | 亚洲五码在线观看视频 | 亚洲国产欧美视频 | 69成人免费视频 |