人工智能領域迎來一位重量級創業者的身影——前谷歌DeepMind首席科學家、AlphaGo項目核心負責人戴維·席爾瓦(David Silver)宣布在倫敦創立人工智能公司"Ineffable Intelligence"。據知情人士透露,這家初創企業正在推進規模達10億美元的種子輪融資,目前已進入收官階段。這一融資規模與OpenAI前首席科學家伊利亞·蘇茨克維(Ilya Sutskever)2024年創立的Safe Superintelligence(SSI)持平,創下AI初創企業融資新紀錄。
與當前主流的大語言模型技術路線形成鮮明對比,席爾瓦的新公司明確提出要突破傳統范式。其核心戰略是回歸強化學習(Reinforcement Learning)本質,構建能夠自主探索未知領域的智能系統。這種技術路徑不依賴人類既有知識庫,而是通過智能體與環境的持續交互實現自我進化。作為圖靈獎得主查理·薩頓(Charlie Sutton)的得意門生,席爾瓦在強化學習領域深耕二十余年,其學術成果被引用超28萬次,2019年更榮獲ACM計算獎。
2025年4月,席爾瓦與導師薩頓聯合發表的《歡迎來到經驗時代》論文引發學界震動。該研究提出新一代AI系統應聚焦"經驗學習"——通過持續試錯、自我迭代和長期互動積累知識,而非單純依賴靜態數據訓練。這一理論框架直接構成了Ineffable Intelligence的技術基石。論文指出,當前主流的"預訓練+微調"模式存在根本性局限:AI的能力邊界被人類數據規模和質量所束縛,難以實現真正的認知突破。
資本市場對席爾瓦的技術路線表現出強烈信心。參與融資談判的投資人分析,10億美元的天價估值主要基于兩點考量:一是席爾瓦在AI領域的權威地位,二是其提出的"后大模型時代"技術路線具有戰略前瞻性。盡管公司尚未發布任何產品,但多位頂級風投機構已承諾注資,認為這可能是通往通用人工智能(AGI)的全新路徑。
這場技術路線之爭正引發AI界的深刻變革。2024年以來,多位參與AlphaGo項目的核心成員陸續離職創業,其中Reflection AI同樣聚焦強化學習領域。meta首席AI科學家楊立昆(Yann LeCun)則帶領團隊重組"超級智能實驗室",探索非Transformer架構的新路徑。行業觀察家指出,當前局面與2010年代深度學習爆發前夜頗為相似,學界普遍意識到現有大模型可能并非通往AGI的終極方案。
不過,席爾瓦的激進路線也面臨現實挑戰。批評者指出,強化學習在圍棋等規則明確的環境中表現優異,但在現實世界這類開放環境中,其有效性尚未得到充分驗證。大語言模型的成功恰恰在于語言作為人類智慧載體的高效性——通過學習語言,AI能以較低成本獲取常識知識。若完全摒棄這條路徑,Ineffable Intelligence可能需要構建極其復雜的數字孿生系統,其算力成本將呈指數級增長。
據悉,Ineffable Intelligence已在倫敦設立總部,并啟動全球頂尖強化學習專家的招募計劃。雖然公司尚未公布具體產品路線圖,但其技術方向和資源投入規模,已使其成為影響AI技術演進的關鍵力量。這場由技術理想主義驅動的創業實驗,或將重新定義人工智能的發展邊界。












