滾動(dòng)資訊

當(dāng)前位置：首頁 > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

AlphaGo核心人物戴維·席爾瓦創(chuàng)業(yè)：繞開大模型，探索強(qiáng)化學(xué)習(xí)新路徑

時(shí)間：2026-02-21 00:03:28 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無障礙通道

前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦（David Silver）近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence"，引發(fā)科技界廣泛關(guān)注。這家初創(chuàng)企業(yè)正推進(jìn)總額達(dá)10億美元的種子輪融資，規(guī)模已接近OpenAI前首席科學(xué)家伊利亞·蘇茨克維（Ilya Sutskever）創(chuàng)立的Safe Superintelligence（SSI）所創(chuàng)下的融資紀(jì)錄。

與當(dāng)前主流的大語言模型技術(shù)路徑不同，席爾瓦提出要突破現(xiàn)有框架，回歸強(qiáng)化學(xué)習(xí)的本質(zhì)。他主張構(gòu)建能夠自主探索未知領(lǐng)域的智能系統(tǒng)，而非依賴人類既有知識(shí)庫。這種技術(shù)理念源于其長(zhǎng)期研究實(shí)踐——作為圖靈獎(jiǎng)得主查理·薩頓（Charlie Sutton）的門生，席爾瓦的學(xué)術(shù)論文累計(jì)被引用超過28萬次，2019年更獲得ACM計(jì)算獎(jiǎng)。

2025年4月，席爾瓦與導(dǎo)師聯(lián)合發(fā)表的《歡迎來到經(jīng)驗(yàn)時(shí)代》論文系統(tǒng)闡述了其技術(shù)主張。他們認(rèn)為新一代AI系統(tǒng)應(yīng)通過持續(xù)與環(huán)境交互獲取經(jīng)驗(yàn)，而非單純依賴靜態(tài)數(shù)據(jù)訓(xùn)練。這種思路直接體現(xiàn)在新公司的技術(shù)方向上：開發(fā)能夠自我迭代、通過試錯(cuò)積累知識(shí)的超級(jí)智能系統(tǒng)。

資本市場(chǎng)對(duì)這位技術(shù)領(lǐng)袖的押注頗具戰(zhàn)略眼光。接近交易的投資人透露，10億美元融資的達(dá)成主要基于兩點(diǎn)考量：席爾瓦在強(qiáng)化學(xué)習(xí)領(lǐng)域的權(quán)威地位，以及其提出的"后大模型時(shí)代"技術(shù)路線可能帶來的顛覆性突破。當(dāng)前主流AI模型均采用"預(yù)訓(xùn)練+微調(diào)"模式，通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律，但席爾瓦指出這種路徑存在根本性局限——AI的能力上限被人類數(shù)據(jù)規(guī)模所束縛。

在席爾瓦看來，現(xiàn)有技術(shù)路線過度依賴人類反饋強(qiáng)化學(xué)習(xí)（RLHF），導(dǎo)致模型認(rèn)知水平難以突破評(píng)估員的認(rèn)知邊界。"要實(shí)現(xiàn)超越人類的智能，必須讓AI具備自主探索能力。"他在近期播客節(jié)目中強(qiáng)調(diào)，"真正的突破需要發(fā)現(xiàn)人類尚未掌握的規(guī)律。"

科技界正經(jīng)歷顯著的技術(shù)路線分化。除席爾瓦外，參與AlphaGo項(xiàng)目的多名科學(xué)家近期創(chuàng)立Reflection AI，meta則在楊立昆（Yann LeCun）帶領(lǐng)下重組"超級(jí)智能實(shí)驗(yàn)室"，探索非Transformer架構(gòu)的新路徑。行業(yè)觀察家指出，當(dāng)前局面類似于深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期，各大實(shí)驗(yàn)室都在尋找突破大語言模型局限的新方案。

不過，強(qiáng)化學(xué)習(xí)路線也面臨現(xiàn)實(shí)挑戰(zhàn)。批評(píng)者認(rèn)為，該技術(shù)在圍棋等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異，但在現(xiàn)實(shí)世界這種開放環(huán)境中，稀疏的反饋信號(hào)和模糊的規(guī)則體系可能限制其有效性。完全摒棄語言學(xué)習(xí)路徑意味著需要構(gòu)建極其復(fù)雜的數(shù)字孿生系統(tǒng)，其算力需求可能呈指數(shù)級(jí)增長(zhǎng)。

目前，Ineffable Intelligence已在倫敦組建核心團(tuán)隊(duì)，并啟動(dòng)全球頂尖強(qiáng)化學(xué)習(xí)專家的招募工作。雖然尚未公布具體產(chǎn)品時(shí)間表，但這家初創(chuàng)企業(yè)的技術(shù)方向和資源投入，已被視為影響AI技術(shù)演進(jìn)的關(guān)鍵變量。其能否突破現(xiàn)有技術(shù)瓶頸，或?qū)⒅匦露x人工智能的發(fā)展軌跡。

02-21

印度AI實(shí)驗(yàn)室Sarvam發(fā)布兩款MoE架構(gòu)大語言模型本地化測(cè)試表現(xiàn)亮眼

02-20

OpenAI進(jìn)軍硬件領(lǐng)域組建200人團(tuán)隊(duì)，無屏AI音箱或2027年面世售價(jià)200-300美元

IT之家 2 月 20 日消息，OpenAI 正在從一家純粹的軟件公司向硬件領(lǐng)域擴(kuò)張。《TheInformation》今日?qǐng)?bào)道稱，OpenAI 已經(jīng)組建了一支約 200 人的研發(fā)團(tuán)隊(duì)，專門開發(fā)面向消費(fèi)者（…

02-20

特斯拉Cybercab下線：無方向盤踏板后視鏡，專為Robotaxi服務(wù)而生

02-20

16歲高中生“智斗”詐騙團(tuán)伙助力Netgear網(wǎng)件追回巨額損失護(hù)品牌

02-20

OpenAI組建200人團(tuán)隊(duì)進(jìn)軍硬件領(lǐng)域，無屏AI音箱或2027年2月面世

02-20

Meta持續(xù)調(diào)整戰(zhàn)略：2026年關(guān)閉Messenger.com網(wǎng)頁僅保留移動(dòng)端與Facebook渠道

02-20

谷歌Gemini 3.1 Pro重磅登場(chǎng)：推理性能躍升，多領(lǐng)域應(yīng)用創(chuàng)新可期

這款升級(jí)版模型專為科學(xué)、工程與研究領(lǐng)域的復(fù)雜問題設(shè)計(jì)，通過強(qiáng)化核心推理能力，顯著提升了解決前沿難題的效率與精準(zhǔn)度。企業(yè)用戶可登錄VertexAI與Gemini Enterprise平臺(tái)獲取服務(wù)；普通消費(fèi)…

02-20

王騰告別小米系轉(zhuǎn)用iPhone 17 跨界睡眠健康賽道引關(guān)注

快科技2月20日消息，原小米中國區(qū)市場(chǎng)部總經(jīng)理、REDMI品牌總經(jīng)理，現(xiàn)任今日宜休科技創(chuàng)始人王騰的一條微博，意外引發(fā)數(shù)碼圈熱議。其分享睡眠質(zhì)量改善的內(nèi)容，發(fā)布設(shè)備顯示為iPhone 17，這也是他自2025…

02-20

3999元！amazfit T-Rex Ultra 2戶外旗艦表發(fā)布：雙頻定位最長(zhǎng)177小時(shí)續(xù)航

快科技2月20日消息，今天amazfit全球同步發(fā)布全新戶外旗艦手表T-Rex Ultra 2，其在續(xù)航、導(dǎo)航、戶外安全三大方面進(jìn)行了升級(jí)。T-Rex Ultra 2采用1.5英寸AMOLED顯示屏，搭配藍(lán)…

02-20

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競(jìng)爭(zhēng)格局或迎新變局

谷歌近日正式發(fā)布了其最新的人工智能模型——Gemini 3.1Pro，這一版本的推理能力相比前作翻倍，達(dá)到了77.1%的ARC-AGI-2基準(zhǔn)得分，標(biāo)志著谷歌在AI領(lǐng)域的又一次重大突破。此外，Gemin…

02-20

特斯拉Cybercab正式下線：無方向盤踏板后視鏡 4月開啟生產(chǎn)

02-20

賣不出去！特斯拉Cybertruck降價(jià)1.5萬美元

02-20

科技整活！PS5手柄直接操控大疆掃地機(jī)器人

02-20

谷歌發(fā)布Gemini 3.1 Pro 推理性能較上一代提升超一倍

02-20

點(diǎn)擊查看更多 +

全站最新

比亞迪122度磷酸鐵鋰刀片電池登場(chǎng)！三大創(chuàng)新解決痛點(diǎn)，開啟電動(dòng)出行新時(shí)代

經(jīng)典重現(xiàn)！伏爾加借力長(zhǎng)安汽車，俄羅斯汽車市場(chǎng)再掀新波瀾

年后手機(jī)圈大戲開場(chǎng)！OPPO Find X9 Ultra與vivo X300 Ultra影像對(duì)決誰更強(qiáng)？

年后手機(jī)圈“卷”影像！OPPO Find X9 Ultra與vivo X300 Ultra攜增距鏡來襲

美國總統(tǒng)特朗普：政府停擺沖擊經(jīng)濟(jì)，呼吁美聯(lián)儲(chǔ)降息

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競(jìng)爭(zhēng)格局或迎新變局

熱門內(nèi)容

本欄最新

特斯拉Cybercab下線：無方向盤踏板后視鏡，專為Robotaxi服務(wù)而生

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競(jìng)爭(zhēng)格局或迎新變局

特斯拉Cybercab正式下線：無方向盤踏板后視鏡 4月開啟生產(chǎn)

消費(fèi)降級(jí)下年輕人如何選車？博越L憑均衡實(shí)力成燃油SUV“黑馬”

特斯拉調(diào)整Cybertruck策略：推59990美元入門款，頂配“野獸版”降價(jià)回漲前水平

春晚機(jī)器人“組團(tuán)”引爆消費(fèi)熱潮，抖音電商助力科技好物走進(jìn)千家萬戶

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

AlphaGo核心人物戴維·席爾瓦創(chuàng)業(yè)：繞開大模型，探索強(qiáng)化學(xué)習(xí)新路徑