在人工智能領域,沒有博士學位和論文發表經歷,是否意味著與頂尖實驗室無緣?Keller Jordan的故事給出了令人驚喜的答案。這位畢業于加州大學圣地亞哥分校的數學與計算機雙學位畢業生,憑借開源項目和硬核技術實力,成功叩開OpenAI的大門。
2024年末,Keller推出的神經網絡優化器Muon再次引發震動。這個通過Newton-Schulz迭代正交化更新矩陣的創新算法,在NanoGPT和CIFAR-10訓練中刷新世界紀錄。相比主流的AdamW優化器,Muon在處理千億參數模型時展現出顯著優勢,其bf16精度下的穩定運行能力更解決了大規模訓練的算力瓶頸。盡管拒絕為Muon撰寫學術論文,這個開源項目仍在開發者社區持續發酵。
Keller的逆襲并非孤例。谷歌DeepMind的Sholto Douglas在X平臺默默耕耘,通過在Jax項目中的深度貢獻獲得面試機會,最終成為Gemini模型的關鍵開發者;量化分析師Andy Jones憑借自研GPU加速環境和嚴謹消融實驗,在沒有耀眼論文的情況下加入Anthropic。這些案例揭示著AI行業的新趨勢:當開放研究成為主流,可驗證的技術貢獻正在取代傳統學術指標,成為衡量人才的新標尺。







