前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence",引發(fā)科技界廣泛關(guān)注。這家初創(chuàng)企業(yè)正推進(jìn)總額達(dá)10億美元的種子輪融資,規(guī)模已接近OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)創(chuàng)立的Safe Superintelligence(SSI)所創(chuàng)下的融資紀(jì)錄。
與當(dāng)前主流的大語言模型技術(shù)路徑不同,席爾瓦提出要突破現(xiàn)有框架,回歸強(qiáng)化學(xué)習(xí)的本質(zhì)。他主張構(gòu)建能夠自主探索未知領(lǐng)域的智能系統(tǒng),而非依賴人類既有知識(shí)庫。這種技術(shù)理念源于其長(zhǎng)期研究實(shí)踐——作為圖靈獎(jiǎng)得主查理·薩頓(Charlie Sutton)的門生,席爾瓦的學(xué)術(shù)論文累計(jì)被引用超過28萬次,2019年更獲得ACM計(jì)算獎(jiǎng)。
2025年4月,席爾瓦與導(dǎo)師聯(lián)合發(fā)表的《歡迎來到經(jīng)驗(yàn)時(shí)代》論文系統(tǒng)闡述了其技術(shù)主張。他們認(rèn)為新一代AI系統(tǒng)應(yīng)通過持續(xù)與環(huán)境交互獲取經(jīng)驗(yàn),而非單純依賴靜態(tài)數(shù)據(jù)訓(xùn)練。這種思路直接體現(xiàn)在新公司的技術(shù)方向上:開發(fā)能夠自我迭代、通過試錯(cuò)積累知識(shí)的超級(jí)智能系統(tǒng)。
資本市場(chǎng)對(duì)這位技術(shù)領(lǐng)袖的押注頗具戰(zhàn)略眼光。接近交易的投資人透露,10億美元融資的達(dá)成主要基于兩點(diǎn)考量:席爾瓦在強(qiáng)化學(xué)習(xí)領(lǐng)域的權(quán)威地位,以及其提出的"后大模型時(shí)代"技術(shù)路線可能帶來的顛覆性突破。當(dāng)前主流AI模型均采用"預(yù)訓(xùn)練+微調(diào)"模式,通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律,但席爾瓦指出這種路徑存在根本性局限——AI的能力上限被人類數(shù)據(jù)規(guī)模所束縛。
在席爾瓦看來,現(xiàn)有技術(shù)路線過度依賴人類反饋強(qiáng)化學(xué)習(xí)(RLHF),導(dǎo)致模型認(rèn)知水平難以突破評(píng)估員的認(rèn)知邊界。"要實(shí)現(xiàn)超越人類的智能,必須讓AI具備自主探索能力。"他在近期播客節(jié)目中強(qiáng)調(diào),"真正的突破需要發(fā)現(xiàn)人類尚未掌握的規(guī)律。"
科技界正經(jīng)歷顯著的技術(shù)路線分化。除席爾瓦外,參與AlphaGo項(xiàng)目的多名科學(xué)家近期創(chuàng)立Reflection AI,meta則在楊立昆(Yann LeCun)帶領(lǐng)下重組"超級(jí)智能實(shí)驗(yàn)室",探索非Transformer架構(gòu)的新路徑。行業(yè)觀察家指出,當(dāng)前局面類似于深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期,各大實(shí)驗(yàn)室都在尋找突破大語言模型局限的新方案。
不過,強(qiáng)化學(xué)習(xí)路線也面臨現(xiàn)實(shí)挑戰(zhàn)。批評(píng)者認(rèn)為,該技術(shù)在圍棋等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異,但在現(xiàn)實(shí)世界這種開放環(huán)境中,稀疏的反饋信號(hào)和模糊的規(guī)則體系可能限制其有效性。完全摒棄語言學(xué)習(xí)路徑意味著需要構(gòu)建極其復(fù)雜的數(shù)字孿生系統(tǒng),其算力需求可能呈指數(shù)級(jí)增長(zhǎng)。
目前,Ineffable Intelligence已在倫敦組建核心團(tuán)隊(duì),并啟動(dòng)全球頂尖強(qiáng)化學(xué)習(xí)專家的招募工作。雖然尚未公布具體產(chǎn)品時(shí)間表,但這家初創(chuàng)企業(yè)的技術(shù)方向和資源投入,已被視為影響AI技術(shù)演進(jìn)的關(guān)鍵變量。其能否突破現(xiàn)有技術(shù)瓶頸,或?qū)⒅匦露x人工智能的發(fā)展軌跡。










