岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

AlphaGo核心人物戴維·席爾瓦創(chuàng)業(yè):繞開大模型,探索強(qiáng)化學(xué)習(xí)新路徑

   時(shí)間:2026-02-21 00:03:28 來源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評(píng)論無障礙通道
 

前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence",引發(fā)科技界廣泛關(guān)注。這家初創(chuàng)企業(yè)正推進(jìn)總額達(dá)10億美元的種子輪融資,規(guī)模已接近OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)創(chuàng)立的Safe Superintelligence(SSI)所創(chuàng)下的融資紀(jì)錄。

與當(dāng)前主流的大語言模型技術(shù)路徑不同,席爾瓦提出要突破現(xiàn)有框架,回歸強(qiáng)化學(xué)習(xí)的本質(zhì)。他主張構(gòu)建能夠自主探索未知領(lǐng)域的智能系統(tǒng),而非依賴人類既有知識(shí)庫。這種技術(shù)理念源于其長(zhǎng)期研究實(shí)踐——作為圖靈獎(jiǎng)得主查理·薩頓(Charlie Sutton)的門生,席爾瓦的學(xué)術(shù)論文累計(jì)被引用超過28萬次,2019年更獲得ACM計(jì)算獎(jiǎng)。

2025年4月,席爾瓦與導(dǎo)師聯(lián)合發(fā)表的《歡迎來到經(jīng)驗(yàn)時(shí)代》論文系統(tǒng)闡述了其技術(shù)主張。他們認(rèn)為新一代AI系統(tǒng)應(yīng)通過持續(xù)與環(huán)境交互獲取經(jīng)驗(yàn),而非單純依賴靜態(tài)數(shù)據(jù)訓(xùn)練。這種思路直接體現(xiàn)在新公司的技術(shù)方向上:開發(fā)能夠自我迭代、通過試錯(cuò)積累知識(shí)的超級(jí)智能系統(tǒng)。

資本市場(chǎng)對(duì)這位技術(shù)領(lǐng)袖的押注頗具戰(zhàn)略眼光。接近交易的投資人透露,10億美元融資的達(dá)成主要基于兩點(diǎn)考量:席爾瓦在強(qiáng)化學(xué)習(xí)領(lǐng)域的權(quán)威地位,以及其提出的"后大模型時(shí)代"技術(shù)路線可能帶來的顛覆性突破。當(dāng)前主流AI模型均采用"預(yù)訓(xùn)練+微調(diào)"模式,通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律,但席爾瓦指出這種路徑存在根本性局限——AI的能力上限被人類數(shù)據(jù)規(guī)模所束縛。

在席爾瓦看來,現(xiàn)有技術(shù)路線過度依賴人類反饋強(qiáng)化學(xué)習(xí)(RLHF),導(dǎo)致模型認(rèn)知水平難以突破評(píng)估員的認(rèn)知邊界。"要實(shí)現(xiàn)超越人類的智能,必須讓AI具備自主探索能力。"他在近期播客節(jié)目中強(qiáng)調(diào),"真正的突破需要發(fā)現(xiàn)人類尚未掌握的規(guī)律。"

科技界正經(jīng)歷顯著的技術(shù)路線分化。除席爾瓦外,參與AlphaGo項(xiàng)目的多名科學(xué)家近期創(chuàng)立Reflection AI,meta則在楊立昆(Yann LeCun)帶領(lǐng)下重組"超級(jí)智能實(shí)驗(yàn)室",探索非Transformer架構(gòu)的新路徑。行業(yè)觀察家指出,當(dāng)前局面類似于深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期,各大實(shí)驗(yàn)室都在尋找突破大語言模型局限的新方案。

不過,強(qiáng)化學(xué)習(xí)路線也面臨現(xiàn)實(shí)挑戰(zhàn)。批評(píng)者認(rèn)為,該技術(shù)在圍棋等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異,但在現(xiàn)實(shí)世界這種開放環(huán)境中,稀疏的反饋信號(hào)和模糊的規(guī)則體系可能限制其有效性。完全摒棄語言學(xué)習(xí)路徑意味著需要構(gòu)建極其復(fù)雜的數(shù)字孿生系統(tǒng),其算力需求可能呈指數(shù)級(jí)增長(zhǎng)。

目前,Ineffable Intelligence已在倫敦組建核心團(tuán)隊(duì),并啟動(dòng)全球頂尖強(qiáng)化學(xué)習(xí)專家的招募工作。雖然尚未公布具體產(chǎn)品時(shí)間表,但這家初創(chuàng)企業(yè)的技術(shù)方向和資源投入,已被視為影響AI技術(shù)演進(jìn)的關(guān)鍵變量。其能否突破現(xiàn)有技術(shù)瓶頸,或?qū)⒅匦露x人工智能的發(fā)展軌跡。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
主站蜘蛛池模板: 深爱综合网 | 成人免费在线网站 | 在线免费av网站 | 大地资源高清播放在线观看 | 一级片在线免费观看 | 久久精品一二三区 | 日本精品视频一区二区 | 最新av在线 | 三级视频欧美 | 久久久99国产精品免费 | 日韩免费高清视频 | 国产www网站| 日本免费一级片 | 欧美视频福利 | 色黄网站 | 在线观看亚洲专区 | www狠狠操| 黄色中文视频 | 成年人网站在线观看视频 | 欧美性另类 | 日韩欧美亚洲一区二区 | 欧美 中文字幕 | 精品欧美一区二区三区 | 天堂久久久久久 | 日韩乱论| 国产精品嫩草影院精东 | 国内久久 | 国产精品传媒在线观看 | 日韩视频在线一区二区 | 亚洲激情av | 欧美激情 亚洲 | 调教驯服丰满美艳麻麻在线视频 | 成人免费视频网站入口:: | 一区视频 | 动漫日批视频 | 五月天av网站| 久久99精品久久久久久三级 | 欧美一级黄色录像 | 精品在线免费观看视频 | 国产一区二区三区中文字幕 | 男人av在线 |