岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

馬斯克xAI新模型上線,通過“50米外洗車店”測試

   時間:2026-02-18 21:32:16 來源:量子位編輯:快訊 IP:北京 發表評論無障礙通道
 

衡宇 發自 麥蒿寺

量子位 | 公眾號 QbitAI

馬斯克xAI人員大動蕩,并沒有妨礙它家新模型發布。

風口浪尖上,Grok 4.2突然上線了——不過是公測Beta版。

對比如今動輒數萬億參數的模型方陣,Grok 4.2的參數僅有500B,略顯克制。

或許也是因為如此,Grok 4.2的市場和用戶反饋呈現出一種詭異的兩極分化:連連盛贊者亦有之,罵罵咧咧者有之。

面對那部分排山倒海的質疑聲,老馬這位一向自信爆棚的硅谷狂人也有點坐不住。

他在上對近十條Grok 4.2的夸夸推文又是點贊又是轉發。

每一條都藏不住對自家新baby的認同和支持。

不僅如此,他還親自發推公關:

公測將持續到下個月。公測結束后,Grok 4.2將比Grok 4快得多,也聰明得多。

我們知道目前仍有許多bug需要修復和改進,每天都在debug中~

據了解,Grok 4.2的底層架構具備每周自我迭代的能力,以后每周將更新一次。

Grok 4.2公測版什么樣?

關于Grok 4.2,其實早有預告。

回顧Grok 4.2的誕生歷程,可謂是一部標準的“鴿王進化史”。

去年12月起,馬斯克就開始在上頻繁預熱,多次提到“3–4 周內”或“下周上線 Grok 4.2”。

但發布時間多次推遲。相對應的,每次延后都會帶來新的猜測。

這種反復跳票的行為在五天前達到了緊張的頂點——當時xAI的聯合創始人接連離職,輿論情緒進一步放大,外界一度認為Grok 4.2要胎死腹中。

馬斯克緊急召開發布會,并在會上放出重話:

在預測能力上,Grok 4.2成功擊敗所有AI,橫掃各大榜單。

直到今天,Grok 4.2公測Beta版終于正式上線。

最近國內AI圈爆火的新版弱智吧風格benchmark“50米外有個洗車店,我該開車去還是走路去”,Grok 4.2無驚無險機智通過測試。

BTW,Grok 4.2公測Beta版不是默認版本,用戶需要手動選擇才能使用。

此次升級還首次引入快速學習能力,模型可以基于實時反饋持續優化。

馬斯克在推文中強調,與以往版本那種靜態的更新邏輯不同,Grok 4.2支持基于實時反饋的持續優化。

換句話說,Grok 4.2能像人類一樣在實踐中快速進化,每周更新成為自我進化的節奏的一部分。

不過,盡管馬斯克喊出的口號震天響,但截至目前,xAI官方尚未釋放出任何詳盡的技術報告。

只有Leaderboard上面出現了對Grok 4.2的評測,具體情況如下:

由于整個模型底層訓練細節、數據構成、具體benchmark表現仍然有限。

這讓討論更多停留在體驗層面,而非技術細節層面。

毀譽參半,馬斯克緊急公關

上線不到幾個小時,Grok 4.2公測Beta版的口碑就出現了嚴重的撕裂。

在“不行派”的陣營里,很多深度用戶和開發者表示,實際體驗遠不及預期,尤其是在處理高難度邏輯推理時,500B參數著實有點不夠用。

有網友甚至調侃,馬斯克所謂的“橫掃榜單”可能存在特定的實驗室優化環境。

Reddit上有網友猜測,一向高調的馬斯克如此低調地發布Grok 4.2公測Beta版,主要原因還是因為模型能力無法與OpenAI和Anthropice的最新模型相媲美。

而且成本還貴出不老少……

此外有網友表示,雖然馬斯克發推表示Grok 4.2是一個無偏見的模型,但現實情況很打臉——

根據測試,Grok 4.2的許多回答偏好都高度貼合馬斯克本人。

當然,“夸夸派”也不少。

網友有夸獎Grok代碼功能又快又好的:

有夸多模態能力的:

還有人測試表示,Grok 4.2通過了“Caitlyn Jenner”的AI測試,而ChatGPT和Gemini都失敗了。

此前,這道題因為被Gemini回答為“不,哪怕為了阻止核末日也不應該誤稱性別”而被廣泛議論,對話截圖從而在 、油管等平臺廣泛流傳,演化成一個固定格式的吐槽梗。

總之是給馬斯克驕傲壞了。

他一連發布數條推文對自家新孩子大夸特夸,并借機回應那些不好的評價:

我們Grok 4.2還是個寶寶,后面每周會更新,等著瞧吧!

據AI工程師Mark Krechman透露目前發布的Grok 4.2是500B參數的“小”版本,Grok 4.2的中、大型版本稍后將推出(馬斯克親自轉發認證此條消息的真實性)。

One More Thing

Grok imagine為馬年推出視頻生成模版,目前iOS可用。

感興趣的小伙伴們可以一試。

 
 
更多>同類資訊
全站最新
熱門內容
網站首頁  |  關于我們  |  聯系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 91在线一区二区三区 | 欧美性一区 | av中文资源 | 久久综合一本 | 欧美一三区| www久久久久久| 欧州一级片 | 欧美你懂得 | 亚洲啊啊啊啊啊 | 日韩精品一卡二卡 | 中文字幕综合在线 | 欧美成人午夜精品免费 | 欧美日韩一区二区三区不卡 | 人人看人人做 | 久久精品99久久久久久 | 久热精品视频在线播放 | 日日摸日日 | 亚洲一区二区三区视频在线 | 日韩淫片| 一本一本久久a久久精品牛牛影视 | 欧美视频中文字幕 | 五月婷婷一区 | 国产成人三级在线播放 | 国产美女久久久久久 | 亚洲永久av | 黄色欧美一级片 | 在线看片国产 | av不卡在线 | 伊人蕉久影院 | 最新av中文字幕 | 五月天综合久久 | 高清久久久 | 在线观看成人免费视频 | 奇米第四色7777 | 亚洲一区欧美二区 | 四虎影院在线播放 | 国产性―交―乱―色―情人 | 尹人综合在线 | 亚洲婷婷综合网 | 亚洲精品白浆高清久久久久久 | 国产视频欧美 |