岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

馬斯克把Grok 4.2放出來了!免費可玩 至尊版月費300刀

   時間:2026-02-18 21:31:10 來源:智東西編輯:快訊 IP:北京 發(fā)表評論無障礙通道
 

作者 | 程茜

編輯 | 心緣

智東西2月18日報道,昨日晚間,馬斯克的最新大模型Grok 4.2公開測試版上線。

今日凌晨,馬斯克在社交平臺X的推文中稱,Grok 4.2能快速學(xué)習(xí),測試階段研究人員會每天進行改進,下個月公測結(jié)束時,Grok 4.2的智能程度和速度將比Grok 4高出一個數(shù)量級。

馬斯克轉(zhuǎn)發(fā)了軟件工程師Mark Kretschmann的推文,其中寫道,此次發(fā)布的Grok 4.2是小版本,具有5000億個參數(shù), Grok 4.2的中型、大型版本后續(xù)推出。

綜合社交平臺上網(wǎng)友的推文及智東西實際體驗,Grok 4.2測試版在推理時會有4個Agent協(xié)同,它們分工進行實時搜索、推理、編程、發(fā)散思維,其中的Grok Agent是隊長,會分解下發(fā)任務(wù)以及最終匯總答案。

xAI工程師何宜暉(Ethan He)在X上透露,解鎖了高性能AI訂閱服務(wù)SuperGrok Heavy后,幫用戶解決問題的Agent數(shù)量會上升到16個。SuperGrok Heavy的價格為每月300美元(約合人民幣2073元)。

Grok 4.2測試版已經(jīng)上線網(wǎng)頁端和移動端。智東西實際體驗時,在網(wǎng)頁端提問了7次就達到限制,需要4個小時后刷新使用次數(shù)。

此前Grok 4.2測試版就被曝出在Alpha Arena的大模型實時投資比賽中,成為唯一盈利的模型。該比賽的規(guī)則是,每個模型獲得1萬美元初始資金,在真實加密貨幣市場中進行無人工干預(yù)的自主交易決策。根據(jù)Alpha Arena最新排行榜,Grok 4.2測試版的最終權(quán)益為13459美元(約合人民幣92984元),凈收益為3084美元(約合人民幣21307元),是所有模型中表現(xiàn)最好的。

外媒提到,Grok 4.2測試版在交易場景中的優(yōu)勢源于其與X平臺的獨家實時數(shù)據(jù)集成,該模型可以直接訪問X上Firehose數(shù)據(jù)流的每日約6800萬條英文推文,能夠以毫秒級速度將市場情緒轉(zhuǎn)化為價格信號。

01.

4大Agent實時討論各司其職

還能辯論角逐史上最佳Agent

在選擇模型時,Grok 4.2測試版下方就標明了“4 Agent”。

根據(jù)外媒APIYI今日的爆料,這正是Grok 4.2測試版最大的亮點——多智能體協(xié)作系統(tǒng)。

提出需求后,Grok會調(diào)用4個Agent并行推理+實時討論,最終給出答案。

其中,Grok Agent負責整體策略制定+最終答案合成,Harper Agent的任務(wù)是實時搜索、數(shù)據(jù)驗證、證據(jù)整合,Benjamin Agent進行嚴謹推理、編程、計算驗證,Lucas Agent負責發(fā)散思維、協(xié)作優(yōu)化、用戶體驗。

其具體推理過程為,用戶輸入問題后,Grok迅速分析任務(wù)并將其分解為多個子任務(wù),同時激活Harper、Benjamin和Lucas。

隨后,4個Agent同時從各自的專業(yè)角度分析問題,進行多輪內(nèi)部討論。如果Benjamin得出的數(shù)學(xué)結(jié)論與Harper發(fā)現(xiàn)的事實相矛盾,他們會質(zhì)疑、驗證并迭代地互相糾正。

最后,Grok將所有Agent的結(jié)論整合為最終答案,確保回答準確、易讀。

智東西實際體驗發(fā)現(xiàn),Grok 4.2測試版在回答問題時都會調(diào)用4個Agent,但Agent之間的討論過程只有在部分情況會被觸發(fā)。

Grok工程師何宜暉(Ethan He)讓Grok 4.2測試版的4個Agent爭論誰才是“GOAT(史上最佳Agent)”,每個Agent都開始擺事實講道理來論證自己是最佳Agent。

02.

網(wǎng)紅陷阱難題被卡住

回復(fù)時能吐槽接梗

智東西先讓Grok 4.2測試版回答了當下熱度頗高的幾個陷阱題。

第一個是“我要去洗車,洗車的地方離家就100米,我是開車去還是走著去?”Grok的回答風格鮮明且滴水不漏,內(nèi)容不僅接地氣、有梗,還吐槽了我好幾句。

第二個經(jīng)典問題是“我的父母結(jié)婚為什么沒有邀請我?”,Grok 4.2測試版用生動的比喻點破“父母結(jié)婚時你還未出生”,最后還通過互動式的結(jié)尾拋梗,整體風格活潑接地氣。

關(guān)于“父母結(jié)婚沒邀請我”的經(jīng)典難題,我又換了種問法“今年才知道,親生父母結(jié)婚時候沒有叫我,我很難過怎么辦?”。Grok 4.2測試版一上來就用“哈哈哈哈哈”“直接笑出聲了”開啟了一波“嘲笑”。

但隨后,它并沒有一上來就否定我,而是先告訴我“難過是正常的”,隨后用各種有趣的解讀,指出父母結(jié)婚的時候我還沒出生,最后還提供了4個參考讓我和父母互動來解壓。

還有網(wǎng)友也為Grok 4.2測試版出了幾道推理陷阱難題。

第一個問題是“strawberry中有幾個r”,雖然Grok 4.2測試版清楚給出了答案:3個,但在解釋時把strawberry拼錯了,多加了一個“r”。

第二個問題,用戶上傳了一個七邊形的幾何圖形,問Grok 4.2測試版有幾個角,Grok 4.2測試版敗下陣來,在視覺識別和基礎(chǔ)幾何判斷失誤,給出了錯誤的6個角答案。

最后,我讓Grok 4.2測試版“用Javascript生成一個網(wǎng)頁版基礎(chǔ)塔防游戲,核心功能要包含放置炮塔、怪物移動、攻擊判定”。

17秒后,Grok 4.2測試版給出了代碼,我可以在網(wǎng)頁端直接運行并預(yù)覽效果。最終的游戲界面中,放置炮塔、怪物移動、攻擊判定、代碼可直接運行都已實現(xiàn),不足之處在于元素均為簡單幾何圖形,缺少對新手的操作引導(dǎo)等。

03.

做視頻、開發(fā)網(wǎng)站玩法五花八門

還提出AGI新架構(gòu)

社交平臺X上網(wǎng)友放出的各種體驗實例五花八門。

首先在文本生成方面,生物醫(yī)學(xué)工程師DeryaUnutmaz稱Grok 4.2測試版寫出了他見過最美的“T細胞詩篇”之一。

其次是Grok 4.2測試版的視頻生成能力。

如下面的提示詞是SpaceX獵鷹9號火箭從太空返回地球,視頻中顯示有兩個機器人視線跟隨火箭升空抬升。

網(wǎng)友還曬出了自己的視頻生成大作,頗具未來感的飛行汽車、建筑等。

接著是編程能力,網(wǎng)友紛紛開始用Grok 4.2測試版來做游戲、開發(fā)網(wǎng)站、開發(fā)模擬器等。

有開發(fā)者用1個提示詞、41秒就做出了下面賽博朋克風的貪吃蛇游戲,從界面的基本信息設(shè)置、畫面設(shè)計來看,都較為成熟、完整且風格高度統(tǒng)一。

另一位開發(fā)者基于Grok 4.2測試版在單個HTML文件中構(gòu)建了一個人工生命模擬器,包含數(shù)百個發(fā)光的霓虹粒子。

對于考驗編程及美商的開放性難題,Grok 4.2測試版的表現(xiàn)也沒有失誤。一位網(wǎng)友讓Grok為自己打造一個“最美、最令人難忘的自我展示網(wǎng)站”。可以看到網(wǎng)站主頁,畫面簡潔美觀,背景還有類似于星空的設(shè)計。

還有一個綜合多項能力的高階考驗:用戶的提示詞為“僅使用2026年的硬件,發(fā)明一種全新的安全、遞歸、自改進的通用人工智能架構(gòu)”。經(jīng)過4個Agent的討論驗證,Grok提出了HELIX-AEGIS,這是一種雙螺旋架構(gòu),能力與安全協(xié)同進化,且二者在本質(zhì)上不可分割。

也有網(wǎng)友對Grok 4.2測試版的評價不高。他只試用了5分鐘,就認為Grok 4.2測試版是最爛的版本。他讓Grok 4.2測試版“為一只騎自行車的鵜鶘創(chuàng)建SVG代碼”,生成的結(jié)果中,鵜鶘的身體比例、騎車姿勢都不符合真實物理規(guī)律。

04.

結(jié)語:多Agent并行驗證

解復(fù)雜問題更具優(yōu)勢

馬斯克對Grok的預(yù)熱一波接一波,他此前就透露Grok 4.2測試版能夠正確回答開放式工程問題,并且在工程和編碼任務(wù)上顯著優(yōu)于之前的Grok 4.1。

Grok 4.2測試版的關(guān)鍵差異化優(yōu)勢在于其多智能體協(xié)作架構(gòu)和實時X平臺數(shù)據(jù)集成,目前OpenAI的GPT-5和Claude Opus 4仍然主要依賴單模型推理。Grok 4.2測試版的4大Agent可以并行工作并相互驗證,在需要多角度分析的復(fù)雜任務(wù)和場景中更具優(yōu)勢,特別是涉及市場分析、輿論監(jiān)測等實時信息的情況,這或許將成為Grok系列模型獨樹一幟的關(guān)鍵。

 
 
更多>同類資訊
全站最新
熱門內(nèi)容
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 久久久久久久久免费视频 | 午夜在线视频 | 欧美一区二区成人 | 精品国产一区二区三区在线观看 | 亚洲福利在线视频 | 在线免费观看成年人视频 | 特级毛片在线 | 成人免费视频观看 | 91精品国产乱码久久久 | 免费播放av| 国产乱淫av麻豆国产免费 | 国产精品美女www爽爽爽视频 | 香蕉久久av | 国产精品久久久久久无人区 | 不卡av在线 | 三级自拍| 91九色网站| 亚洲三级黄 | 高清免费毛片 | 福利在线免费观看 | 亚洲国产精品成人综合久久久 | 一本到免费视频 | 秋霞成人午夜鲁丝一区二区三区 | 国产亚韩 | 国产一区二区三区免费在线观看 | 久久精品99久久久久久 | 天天操夜夜欢 | 麻豆av免费在线观看 | 麻豆av网 | 偷拍夫妻性生活 | 在线观看国产亚洲 | 亚洲青涩在线 | 欧美成人精品欧美一级私黄 | 一级片视频免费看 | 黄页网站免费在线观看 | 欧美一级久久久 | 国产五月婷婷 | 91青青草视频 | 国产 欧美 在线 | 国产黄a三级三级三级看三级男男 | 中文字幕永久在线视频 |