岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè):繞開大模型,以強(qiáng)化學(xué)習(xí)叩響超級智能之門

   時(shí)間:2026-02-21 01:39:04 來源:快訊編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence",并啟動(dòng)規(guī)模達(dá)10億美元的種子輪融資。這一融資規(guī)模與OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024年創(chuàng)立Safe Superintelligence(SSI)時(shí)持平,標(biāo)志著AI領(lǐng)域新一輪技術(shù)路線競爭的開啟。

與當(dāng)前主流的大語言模型(LLM)技術(shù)路徑不同,席爾瓦提出要"回歸強(qiáng)化學(xué)習(xí)本質(zhì)"。他主張構(gòu)建完全自主的智能系統(tǒng),通過與環(huán)境交互積累經(jīng)驗(yàn),而非依賴人類標(biāo)注的文本數(shù)據(jù)。這一理念源于其2025年4月與導(dǎo)師查理·薩頓(Charlie Sutton)聯(lián)合發(fā)表的論文《歡迎來到經(jīng)驗(yàn)時(shí)代》,論文強(qiáng)調(diào)智能體應(yīng)通過持續(xù)試錯(cuò)實(shí)現(xiàn)自我進(jìn)化。

作為強(qiáng)化學(xué)習(xí)領(lǐng)域的標(biāo)志性人物,席爾瓦的學(xué)術(shù)影響力顯著。其論文被引用超28萬次,2019年獲得的ACM計(jì)算獎(jiǎng)印證了他在該領(lǐng)域的技術(shù)權(quán)威性。更引人注目的是,他主導(dǎo)開發(fā)的AlphaGo、AlphaZero和MuZero等系統(tǒng),已驗(yàn)證強(qiáng)化學(xué)習(xí)在規(guī)則明確環(huán)境中的突破性潛力——AlphaZero僅用三天自我對弈就超越人類千年圍棋經(jīng)驗(yàn),MuZero更在完全不知規(guī)則的情況下掌握多類游戲策略。

技術(shù)路線的分歧正在重塑AI產(chǎn)業(yè)格局。當(dāng)前主流模型如GPT系列和Gemini系列,均采用"預(yù)訓(xùn)練+微調(diào)"范式,通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律。但席爾瓦指出,這種路徑存在根本性局限:AI的能力上限被人類標(biāo)注數(shù)據(jù)的質(zhì)量和數(shù)量所束縛。他特別批評了依賴人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的后訓(xùn)練方式,認(rèn)為這導(dǎo)致模型認(rèn)知水平無法超越人類評估員。

Ineffable Intelligence的愿景是打造"持續(xù)學(xué)習(xí)的超級智能"。知情人士透露,該公司計(jì)劃開發(fā)能通過模擬環(huán)境自我博弈的系統(tǒng),從基礎(chǔ)原理推導(dǎo)問題解決方案。這種技術(shù)路線在AlphaGo與李世石對決中已現(xiàn)端倪——第37手看似違背所有已知定式,實(shí)則是AI通過計(jì)算發(fā)現(xiàn)的人類未知規(guī)律,這種"不可言說"的智慧正是公司名稱的由來。

資本市場對席爾瓦的押注反映了對"后大模型時(shí)代"的技術(shù)期待。接近交易的投資人表示,10億美元融資主要基于兩點(diǎn):席爾瓦在DeepMind期間證明的技術(shù)轉(zhuǎn)化能力,以及強(qiáng)化學(xué)習(xí)在復(fù)雜決策場景中的潛在突破。但質(zhì)疑聲同樣存在:現(xiàn)實(shí)世界存在規(guī)則模糊、反饋稀疏等挑戰(zhàn),強(qiáng)化學(xué)習(xí)在此類環(huán)境中的有效性尚未得到充分驗(yàn)證。

AI領(lǐng)域正經(jīng)歷路線分化。除席爾瓦外,參與AlphaGo項(xiàng)目的部分科學(xué)家近期創(chuàng)立了Reflection AI,meta則在楊立昆帶領(lǐng)下重組"超級智能實(shí)驗(yàn)室"探索新架構(gòu)。這種局面被行業(yè)觀察家比作2010年代深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期——當(dāng)時(shí)主流方法尚未收斂,不同學(xué)派在競爭中推動(dòng)技術(shù)躍遷。

目前,Ineffable Intelligence已在倫敦組建核心團(tuán)隊(duì),并啟動(dòng)全球強(qiáng)化學(xué)習(xí)專家的招募計(jì)劃。盡管尚未公布產(chǎn)品路線圖,但該公司對算力資源的巨額投入,預(yù)示其可能構(gòu)建超大規(guī)模的數(shù)字孿生系統(tǒng)進(jìn)行AI訓(xùn)練。這場由技術(shù)理念差異引發(fā)的產(chǎn)業(yè)變革,或?qū)⒅匦露x通用人工智能(AGI)的發(fā)展路徑。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
 
主站蜘蛛池模板: 欧美黄色大片免费看 | 欧美亚洲日本在线 | 欧美久久久久久久久久久久 | 四虎影视在线观看 | 亚洲黄色片网站 | 波多野结衣午夜 | 国产成人精品亚洲男人的天堂 | 欧美精品123 | 亚洲第一免费播放区 | 青青草好吊色 | 国产精品一区二区三区在线 | 99自拍| 日韩1区2区3区 | 一级片亚洲 | 国产婷婷色一区二区三区 | 成人欧美一区二区三区在线观看 | 五月天婷婷网站 | 国产精品三| 成人免费网站在线观看 | 激情综合五月天 | 国产又黄视频 | 中文字幕免费高 | 三级三级久久三级久久18 | 日本视频一区二区 | 日日狠狠久久偷偷四色综合免费 | 四虎视频国产精品免费 | 五月婷网 | 亚洲视频中文 | 男人天堂网在线视频 | 98国产在线 | 男女av | 国产精品一区二区视频 | 国产精品福利一区二区三区 | av视屏在线 | 久久国产影院 | 香蕉av网站 | 午夜在线网站 | 三级黄视频 | h网站在线 | 国产美女网站 | 日日网站|