岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

智譜創(chuàng)始人唐杰:2026年AI for Science迎爆發(fā),智譜專注創(chuàng)新謀突破

   時(shí)間:2026-01-11 12:12:15 來(lái)源:互聯(lián)網(wǎng)編輯:快訊 IP:北京 發(fā)表評(píng)論無(wú)障礙通道
 

近期,大模型領(lǐng)域發(fā)展勢(shì)頭迅猛,智譜AI與minimax相繼完成上市,月之暗面KIMI也成功獲得5億美元融資,整個(gè)行業(yè)正從概念階段加速邁向商業(yè)化落地。

在智譜AI成功上市后,其創(chuàng)始人、清華大學(xué)教授唐杰發(fā)表了一場(chǎng)公開(kāi)演講。他指出,2026年極有可能成為AI for Science的爆發(fā)之年,隨著各項(xiàng)能力的顯著提升,眾多領(lǐng)域?qū)⒂瓉?lái)新的發(fā)展契機(jī)。

唐杰詳細(xì)闡述了智譜AI在2026年的重點(diǎn)規(guī)劃。首先,在Scaling方面將持續(xù)推進(jìn),不斷擴(kuò)充數(shù)據(jù)規(guī)模,探索模型性能的上限,同時(shí)積極探索未知的新范式。其次,技術(shù)創(chuàng)新是關(guān)鍵,公司將致力于全新的模型架構(gòu)研發(fā),著力解決超長(zhǎng)上下文處理、高效知識(shí)壓縮等難題,并實(shí)現(xiàn)知識(shí)記憶與持續(xù)學(xué)習(xí)功能,為模型賦予更強(qiáng)大的能力。多模態(tài)感統(tǒng)能力將成為今年的熱點(diǎn)與重點(diǎn),這一能力的突破將使AI能夠勝任機(jī)器中的長(zhǎng)任務(wù)、長(zhǎng)時(shí)效任務(wù),進(jìn)而在人類的工作環(huán)境中發(fā)揮作用,助力AI實(shí)現(xiàn)具身智能,真正融入物理世界。

唐杰回顧了自己的科研歷程,自2006年從清華大學(xué)畢業(yè)后的20年里,他主要專注于兩件事:一是開(kāi)發(fā)AMiner系統(tǒng),二是投身于大模型研究。他以“像喝咖啡一樣上癮”的精神投身科研,這種專注與堅(jiān)持促使他抓住了AGI這一長(zhǎng)期投入領(lǐng)域的機(jī)遇。

智譜AI實(shí)驗(yàn)室在2019年做出了重大戰(zhàn)略調(diào)整,暫停了當(dāng)時(shí)在國(guó)際上表現(xiàn)不錯(cuò)的圖神經(jīng)網(wǎng)絡(luò)和知識(shí)圖譜研究方向,全體人員轉(zhuǎn)向大模型研究。經(jīng)過(guò)多年的努力,取得了顯著成果。從大模型智能水平的發(fā)展歷程來(lái)看,2020年時(shí)模型僅能處理一些簡(jiǎn)單的MMU和QA問(wèn)題,到2021 - 2022年已能夠完成數(shù)學(xué)推理題,再到2023 - 2024年可以處理研究生水平的復(fù)雜問(wèn)題,甚至在真實(shí)世界的編程問(wèn)題上也表現(xiàn)出色,智能水平不斷提升,如同人類成長(zhǎng)一般逐步積累知識(shí)、提升能力。

在提升模型泛化能力方面,唐杰表示,目前主要通過(guò)Scaling來(lái)實(shí)現(xiàn),但模型的泛化能力仍有待提高。早期通過(guò)Transformer訓(xùn)練模型,數(shù)據(jù)和算力的增加提升了長(zhǎng)時(shí)知識(shí)記憶能力,但泛化能力有限。后來(lái)通過(guò)對(duì)齊和推理,利用持續(xù)的Scaling SFT和強(qiáng)化學(xué)習(xí),尤其是今年可驗(yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)(RLVR)的爆發(fā),使模型能夠通過(guò)可驗(yàn)證環(huán)境自主探索反饋數(shù)據(jù),實(shí)現(xiàn)自我成長(zhǎng)。然而,RLVR也面臨挑戰(zhàn),如可驗(yàn)證場(chǎng)景的局限性,如何拓展到半自動(dòng)或不可驗(yàn)證場(chǎng)景,實(shí)現(xiàn)模型的通用化,是亟待解決的問(wèn)題。同時(shí),未來(lái)機(jī)器將在物理世界承擔(dān)真實(shí)任務(wù),構(gòu)建智能體環(huán)境也面臨諸多挑戰(zhàn)。

2025年初,DeepSeek的出現(xiàn)給研究界和產(chǎn)業(yè)界帶來(lái)了巨大沖擊,其性能強(qiáng)大,令人震撼。唐杰認(rèn)為,在DeepSeek的范式下,Chat時(shí)代的問(wèn)題可能已基本得到解決,未來(lái)AI的發(fā)展將開(kāi)啟新范式,即讓每個(gè)人能夠運(yùn)用AI完成實(shí)際任務(wù)。在這一選擇上,智譜AI選擇了賦予模型Thinking能力,并整合Coding、Agentic、Reasoning能力,于2025年7月28日發(fā)布了4.5版本,在智能體、推理、代碼等多個(gè)Benchmark上取得了優(yōu)異成績(jī)。但該版本在實(shí)際編程場(chǎng)景中也暴露出一些問(wèn)題,如無(wú)法完成復(fù)雜的“植物大戰(zhàn)僵尸”編程任務(wù),這促使公司利用RLVR可驗(yàn)證的強(qiáng)化學(xué)習(xí)環(huán)境,結(jié)合編程環(huán)境反饋和SFT數(shù)據(jù),提升了模型效果。

在Web能力開(kāi)發(fā)方面,智譜AI也取得了一定進(jìn)展,通過(guò)可驗(yàn)證環(huán)境提升了模型在SWE Bench上的得分。然而,將模型能力整合到主模型仍面臨挑戰(zhàn),真實(shí)用戶體驗(yàn)與跑分結(jié)果可能存在差異。為此,公司開(kāi)發(fā)了全異步的訓(xùn)練強(qiáng)化學(xué)習(xí)框架,統(tǒng)一訓(xùn)練大量RL任務(wù),提升了Agent和Coding能力,最新發(fā)布的4.7版本在相關(guān)方面有了顯著提升。在真實(shí)場(chǎng)景評(píng)測(cè)中,公司邀請(qǐng)眾多編程高手進(jìn)行人工評(píng)測(cè),但仍有許多問(wèn)題有待解決。

在構(gòu)建Coding Agent環(huán)境方面,智譜AI基于Github數(shù)據(jù)實(shí)現(xiàn)了自動(dòng)化構(gòu)建,但將大量RL任務(wù)統(tǒng)一訓(xùn)練也面臨任務(wù)長(zhǎng)度和時(shí)間不同的難題。公司開(kāi)源的全異步訓(xùn)練強(qiáng)化學(xué)習(xí)框架解決了這一問(wèn)題,提升了Agent和Coding能力。同時(shí),在讓AI完成復(fù)雜任務(wù)方面,如監(jiān)控小紅書(shū)并整理相關(guān)討論生成文檔,需要將API與GUI混合使用,通過(guò)抽取大量數(shù)據(jù)并進(jìn)行全異步強(qiáng)化學(xué)習(xí),賦予AI一定的泛化能力。為克服冷啟動(dòng)問(wèn)題,公司采用SFT與強(qiáng)化學(xué)習(xí)交替的訓(xùn)練算法,提升了模型在移動(dòng)環(huán)境下的效果,并在多任務(wù)大模型強(qiáng)調(diào)學(xué)習(xí)上開(kāi)展了相關(guān)工作。

2025年12月,智譜AI開(kāi)源了AutoGLM 9B模型,該模型在人機(jī)交互中執(zhí)行速度快,開(kāi)源后迅速獲得了大量關(guān)注。以旅行規(guī)劃任務(wù)為例,該模型能夠自動(dòng)調(diào)用不同APP,完成景點(diǎn)總結(jié)、地圖收藏、票價(jià)查詢、高鐵票預(yù)訂等一系列操作,相當(dāng)于一個(gè)智能秘書(shū)。在相關(guān)Bench上,該模型也取得了不錯(cuò)的成績(jī),但也帶來(lái)了新的問(wèn)題,即在超大規(guī)模Agent模型上如何保持其他能力的穩(wěn)定。

2025年被稱為GLM的開(kāi)源年,智譜AI從1月到12月開(kāi)源了多個(gè)模型,包括語(yǔ)言模型、智能體模型和多模態(tài)模型等。中國(guó)開(kāi)源模型在2025年取得了顯著貢獻(xiàn),在Artificial Analysis上,前五名基本為中國(guó)模型,大模型盲測(cè)榜單也顯示中國(guó)模型表現(xiàn)出色。但唐杰也指出,不能因開(kāi)源成果而盲目樂(lè)觀,美國(guó)閉源大模型的發(fā)展仍不可忽視,中國(guó)與美國(guó)在大模型領(lǐng)域仍存在差距。

對(duì)于未來(lái)大模型的發(fā)展,唐杰認(rèn)為可以參考人腦認(rèn)知的學(xué)習(xí)過(guò)程。2025年可能是多模態(tài)的適應(yīng)年,目前大多數(shù)模型仍以文本智能提升為主,如何實(shí)現(xiàn)原生多模態(tài)模型,統(tǒng)一感知多模態(tài)信息,是亟待解決的問(wèn)題,這與人類的“感統(tǒng)”能力相似。模型的記憶能力和可持續(xù)學(xué)習(xí)能力也有待提高,人類擁有多級(jí)記憶系統(tǒng),未來(lái)需要為大模型構(gòu)建更完善的記憶系統(tǒng)。同時(shí),反思和自我認(rèn)知能力也是未來(lái)發(fā)展的方向,雖然目前模型已有一定反思能力,但自我認(rèn)知仍是難題,值得深入探索。

人類認(rèn)知具有雙系統(tǒng)特點(diǎn),系統(tǒng)一完成大部分簡(jiǎn)單任務(wù),系統(tǒng)二處理復(fù)雜推理問(wèn)題。大模型發(fā)展也可參考這一模式,通過(guò)Scaling數(shù)據(jù)、推理和自學(xué)習(xí)環(huán)境,讓機(jī)器參考人的學(xué)習(xí)范式,獲得更多學(xué)習(xí)機(jī)會(huì)。在系統(tǒng)一方面,雖然Transformer模型可通過(guò)增加數(shù)據(jù)和參數(shù)提升性能,但面臨計(jì)算復(fù)雜度和顯存等問(wèn)題,需要探索更好的知識(shí)壓縮方法。在系統(tǒng)二方面,需要找到新的Scaling范式,讓機(jī)器能夠自主定義獎(jiǎng)勵(lì)函數(shù)、交互方法和訓(xùn)練任務(wù),實(shí)現(xiàn)自我提升。完成真實(shí)場(chǎng)景下的超長(zhǎng)任務(wù)也是關(guān)鍵,機(jī)器需要具備像人一樣的規(guī)劃、檢查和反饋能力。

 
 
更多>同類資訊
全站最新
熱門(mén)內(nèi)容
網(wǎng)站首頁(yè)  |  關(guān)于我們  |  聯(lián)系方式  |  版權(quán)聲明  |  爭(zhēng)議稿件處理  |  English Version
 
主站蜘蛛池模板: 性生活短视频 | 日本色婷婷 | 国产男女啪啪 | 毛片网站在线看 | 国产一区影视 | 91精品久久香蕉国产线看观看 | 欧美aaa一级片 | 青草视频在线免费观看 | 二区在线播放 | 欧美在线观看不卡 | 一区二区亚洲视频 | 午夜88| 国产毛片视频 | 在线免费看黄色片 | 日本一区二区精品视频 | 亚洲影视一区二区三区 | 91精品国产乱码久久久 | 免费黄色小视频在线观看 | 日韩久久久久久久久久 | 尤物网站在线 | 国产情侣啪啪 | 国产免费黄 | 伊人超碰 | 中文字幕av一区二区三区谷原希美 | 国产精品视频自拍 | 综合网伊人 | 黄网址在线 | 国产精品久久久久久精 | 久久久888 | 美梦视频大全在线观看高清 | 欧美性受xxxx黑人xyx性爽 | 日韩精品一区二区在线播放 | 欧美色图久久 | av手机天堂 | 久久艹精品视频 | 日韩欧美不卡 | 噜噜噜久久,亚洲精品国产品 | 先锋成人 | 日韩av三区 | av免费大片 | 欧美一级特黄高清视频 |