滾動(dòng)資訊

當(dāng)前位置：首頁(yè) > 資訊 > 業(yè)界動(dòng)態(tài) > 正文內(nèi)容

智譜創(chuàng)始人唐杰：2026年AI for Science迎爆發(fā)，智譜專注創(chuàng)新謀突破

時(shí)間：2026-01-11 12:12:15 來(lái)源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評(píng)論無(wú)障礙通道

近期，大模型領(lǐng)域發(fā)展勢(shì)頭迅猛，智譜AI與minimax相繼完成上市，月之暗面KIMI也成功獲得5億美元融資，整個(gè)行業(yè)正從概念階段加速邁向商業(yè)化落地。

在智譜AI成功上市后，其創(chuàng)始人、清華大學(xué)教授唐杰發(fā)表了一場(chǎng)公開(kāi)演講。他指出，2026年極有可能成為AI for Science的爆發(fā)之年，隨著各項(xiàng)能力的顯著提升，眾多領(lǐng)域?qū)⒂瓉?lái)新的發(fā)展契機(jī)。

唐杰詳細(xì)闡述了智譜AI在2026年的重點(diǎn)規(guī)劃。首先，在Scaling方面將持續(xù)推進(jìn)，不斷擴(kuò)充數(shù)據(jù)規(guī)模，探索模型性能的上限，同時(shí)積極探索未知的新范式。其次，技術(shù)創(chuàng)新是關(guān)鍵，公司將致力于全新的模型架構(gòu)研發(fā)，著力解決超長(zhǎng)上下文處理、高效知識(shí)壓縮等難題，并實(shí)現(xiàn)知識(shí)記憶與持續(xù)學(xué)習(xí)功能，為模型賦予更強(qiáng)大的能力。多模態(tài)感統(tǒng)能力將成為今年的熱點(diǎn)與重點(diǎn)，這一能力的突破將使AI能夠勝任機(jī)器中的長(zhǎng)任務(wù)、長(zhǎng)時(shí)效任務(wù)，進(jìn)而在人類的工作環(huán)境中發(fā)揮作用，助力AI實(shí)現(xiàn)具身智能，真正融入物理世界。

唐杰回顧了自己的科研歷程，自2006年從清華大學(xué)畢業(yè)后的20年里，他主要專注于兩件事：一是開(kāi)發(fā)AMiner系統(tǒng)，二是投身于大模型研究。他以“像喝咖啡一樣上癮”的精神投身科研，這種專注與堅(jiān)持促使他抓住了AGI這一長(zhǎng)期投入領(lǐng)域的機(jī)遇。

智譜AI實(shí)驗(yàn)室在2019年做出了重大戰(zhàn)略調(diào)整，暫停了當(dāng)時(shí)在國(guó)際上表現(xiàn)不錯(cuò)的圖神經(jīng)網(wǎng)絡(luò)和知識(shí)圖譜研究方向，全體人員轉(zhuǎn)向大模型研究。經(jīng)過(guò)多年的努力，取得了顯著成果。從大模型智能水平的發(fā)展歷程來(lái)看，2020年時(shí)模型僅能處理一些簡(jiǎn)單的MMU和QA問(wèn)題，到2021 - 2022年已能夠完成數(shù)學(xué)推理題，再到2023 - 2024年可以處理研究生水平的復(fù)雜問(wèn)題，甚至在真實(shí)世界的編程問(wèn)題上也表現(xiàn)出色，智能水平不斷提升，如同人類成長(zhǎng)一般逐步積累知識(shí)、提升能力。

在提升模型泛化能力方面，唐杰表示，目前主要通過(guò)Scaling來(lái)實(shí)現(xiàn)，但模型的泛化能力仍有待提高。早期通過(guò)Transformer訓(xùn)練模型，數(shù)據(jù)和算力的增加提升了長(zhǎng)時(shí)知識(shí)記憶能力，但泛化能力有限。后來(lái)通過(guò)對(duì)齊和推理，利用持續(xù)的Scaling SFT和強(qiáng)化學(xué)習(xí)，尤其是今年可驗(yàn)證獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)（RLVR）的爆發(fā)，使模型能夠通過(guò)可驗(yàn)證環(huán)境自主探索反饋數(shù)據(jù)，實(shí)現(xiàn)自我成長(zhǎng)。然而，RLVR也面臨挑戰(zhàn)，如可驗(yàn)證場(chǎng)景的局限性，如何拓展到半自動(dòng)或不可驗(yàn)證場(chǎng)景，實(shí)現(xiàn)模型的通用化，是亟待解決的問(wèn)題。同時(shí)，未來(lái)機(jī)器將在物理世界承擔(dān)真實(shí)任務(wù)，構(gòu)建智能體環(huán)境也面臨諸多挑戰(zhàn)。

2025年初，DeepSeek的出現(xiàn)給研究界和產(chǎn)業(yè)界帶來(lái)了巨大沖擊，其性能強(qiáng)大，令人震撼。唐杰認(rèn)為，在DeepSeek的范式下，Chat時(shí)代的問(wèn)題可能已基本得到解決，未來(lái)AI的發(fā)展將開(kāi)啟新范式，即讓每個(gè)人能夠運(yùn)用AI完成實(shí)際任務(wù)。在這一選擇上，智譜AI選擇了賦予模型Thinking能力，并整合Coding、Agentic、Reasoning能力，于2025年7月28日發(fā)布了4.5版本，在智能體、推理、代碼等多個(gè)Benchmark上取得了優(yōu)異成績(jī)。但該版本在實(shí)際編程場(chǎng)景中也暴露出一些問(wèn)題，如無(wú)法完成復(fù)雜的“植物大戰(zhàn)僵尸”編程任務(wù)，這促使公司利用RLVR可驗(yàn)證的強(qiáng)化學(xué)習(xí)環(huán)境，結(jié)合編程環(huán)境反饋和SFT數(shù)據(jù)，提升了模型效果。

在Web能力開(kāi)發(fā)方面，智譜AI也取得了一定進(jìn)展，通過(guò)可驗(yàn)證環(huán)境提升了模型在SWE Bench上的得分。然而，將模型能力整合到主模型仍面臨挑戰(zhàn)，真實(shí)用戶體驗(yàn)與跑分結(jié)果可能存在差異。為此，公司開(kāi)發(fā)了全異步的訓(xùn)練強(qiáng)化學(xué)習(xí)框架，統(tǒng)一訓(xùn)練大量RL任務(wù)，提升了Agent和Coding能力，最新發(fā)布的4.7版本在相關(guān)方面有了顯著提升。在真實(shí)場(chǎng)景評(píng)測(cè)中，公司邀請(qǐng)眾多編程高手進(jìn)行人工評(píng)測(cè)，但仍有許多問(wèn)題有待解決。

在構(gòu)建Coding Agent環(huán)境方面，智譜AI基于Github數(shù)據(jù)實(shí)現(xiàn)了自動(dòng)化構(gòu)建，但將大量RL任務(wù)統(tǒng)一訓(xùn)練也面臨任務(wù)長(zhǎng)度和時(shí)間不同的難題。公司開(kāi)源的全異步訓(xùn)練強(qiáng)化學(xué)習(xí)框架解決了這一問(wèn)題，提升了Agent和Coding能力。同時(shí)，在讓AI完成復(fù)雜任務(wù)方面，如監(jiān)控小紅書(shū)并整理相關(guān)討論生成文檔，需要將API與GUI混合使用，通過(guò)抽取大量數(shù)據(jù)并進(jìn)行全異步強(qiáng)化學(xué)習(xí)，賦予AI一定的泛化能力。為克服冷啟動(dòng)問(wèn)題，公司采用SFT與強(qiáng)化學(xué)習(xí)交替的訓(xùn)練算法，提升了模型在移動(dòng)環(huán)境下的效果，并在多任務(wù)大模型強(qiáng)調(diào)學(xué)習(xí)上開(kāi)展了相關(guān)工作。

2025年12月，智譜AI開(kāi)源了AutoGLM 9B模型，該模型在人機(jī)交互中執(zhí)行速度快，開(kāi)源后迅速獲得了大量關(guān)注。以旅行規(guī)劃任務(wù)為例，該模型能夠自動(dòng)調(diào)用不同APP，完成景點(diǎn)總結(jié)、地圖收藏、票價(jià)查詢、高鐵票預(yù)訂等一系列操作，相當(dāng)于一個(gè)智能秘書(shū)。在相關(guān)Bench上，該模型也取得了不錯(cuò)的成績(jī)，但也帶來(lái)了新的問(wèn)題，即在超大規(guī)模Agent模型上如何保持其他能力的穩(wěn)定。

2025年被稱為GLM的開(kāi)源年，智譜AI從1月到12月開(kāi)源了多個(gè)模型，包括語(yǔ)言模型、智能體模型和多模態(tài)模型等。中國(guó)開(kāi)源模型在2025年取得了顯著貢獻(xiàn)，在Artificial Analysis上，前五名基本為中國(guó)模型，大模型盲測(cè)榜單也顯示中國(guó)模型表現(xiàn)出色。但唐杰也指出，不能因開(kāi)源成果而盲目樂(lè)觀，美國(guó)閉源大模型的發(fā)展仍不可忽視，中國(guó)與美國(guó)在大模型領(lǐng)域仍存在差距。

對(duì)于未來(lái)大模型的發(fā)展，唐杰認(rèn)為可以參考人腦認(rèn)知的學(xué)習(xí)過(guò)程。2025年可能是多模態(tài)的適應(yīng)年，目前大多數(shù)模型仍以文本智能提升為主，如何實(shí)現(xiàn)原生多模態(tài)模型，統(tǒng)一感知多模態(tài)信息，是亟待解決的問(wèn)題，這與人類的“感統(tǒng)”能力相似。模型的記憶能力和可持續(xù)學(xué)習(xí)能力也有待提高，人類擁有多級(jí)記憶系統(tǒng)，未來(lái)需要為大模型構(gòu)建更完善的記憶系統(tǒng)。同時(shí)，反思和自我認(rèn)知能力也是未來(lái)發(fā)展的方向，雖然目前模型已有一定反思能力，但自我認(rèn)知仍是難題，值得深入探索。

人類認(rèn)知具有雙系統(tǒng)特點(diǎn)，系統(tǒng)一完成大部分簡(jiǎn)單任務(wù)，系統(tǒng)二處理復(fù)雜推理問(wèn)題。大模型發(fā)展也可參考這一模式，通過(guò)Scaling數(shù)據(jù)、推理和自學(xué)習(xí)環(huán)境，讓機(jī)器參考人的學(xué)習(xí)范式，獲得更多學(xué)習(xí)機(jī)會(huì)。在系統(tǒng)一方面，雖然Transformer模型可通過(guò)增加數(shù)據(jù)和參數(shù)提升性能，但面臨計(jì)算復(fù)雜度和顯存等問(wèn)題，需要探索更好的知識(shí)壓縮方法。在系統(tǒng)二方面，需要找到新的Scaling范式，讓機(jī)器能夠自主定義獎(jiǎng)勵(lì)函數(shù)、交互方法和訓(xùn)練任務(wù)，實(shí)現(xiàn)自我提升。完成真實(shí)場(chǎng)景下的超長(zhǎng)任務(wù)也是關(guān)鍵，機(jī)器需要具備像人一樣的規(guī)劃、檢查和反饋能力。

更多>同類資訊

字節(jié)Seedance2.0延遲API開(kāi)放時(shí)間

02-21

谷歌重磅發(fā)布Gemini 3.1 Pro

02-21

OpenAI組建200人團(tuán)隊(duì)研發(fā)AI硬件，無(wú)屏智能音箱或2027年2月入局智能家居市場(chǎng)

02-21

AlphaGo核心人物戴維·席爾瓦創(chuàng)業(yè)：繞開(kāi)大模型，探索強(qiáng)化學(xué)習(xí)新路徑

02-21

Meta再調(diào)整：2026年4月關(guān)閉Messenger.com 用戶僅能通過(guò)移動(dòng)端或Facebook使用

02-21

印度AI實(shí)驗(yàn)室Sarvam發(fā)布兩款MoE架構(gòu)大語(yǔ)言模型本地化測(cè)試表現(xiàn)亮眼

02-20

OpenAI進(jìn)軍硬件領(lǐng)域組建200人團(tuán)隊(duì)，無(wú)屏AI音箱或2027年面世售價(jià)200-300美元

IT之家 2 月 20 日消息，OpenAI 正在從一家純粹的軟件公司向硬件領(lǐng)域擴(kuò)張。《TheInformation》今日?qǐng)?bào)道稱，OpenAI 已經(jīng)組建了一支約 200 人的研發(fā)團(tuán)隊(duì)，專門(mén)開(kāi)發(fā)面向消費(fèi)者（…

02-20

特斯拉Cybercab下線：無(wú)方向盤(pán)踏板后視鏡，專為Robotaxi服務(wù)而生

02-20

16歲高中生“智斗”詐騙團(tuán)伙助力Netgear網(wǎng)件追回巨額損失護(hù)品牌

02-20

OpenAI組建200人團(tuán)隊(duì)進(jìn)軍硬件領(lǐng)域，無(wú)屏AI音箱或2027年2月面世

02-20

Meta持續(xù)調(diào)整戰(zhàn)略：2026年關(guān)閉Messenger.com網(wǎng)頁(yè) 僅保留移動(dòng)端與Facebook渠道

02-20

谷歌Gemini 3.1 Pro重磅登場(chǎng)：推理性能躍升，多領(lǐng)域應(yīng)用創(chuàng)新可期

這款升級(jí)版模型專為科學(xué)、工程與研究領(lǐng)域的復(fù)雜問(wèn)題設(shè)計(jì)，通過(guò)強(qiáng)化核心推理能力，顯著提升了解決前沿難題的效率與精準(zhǔn)度。企業(yè)用戶可登錄VertexAI與Gemini Enterprise平臺(tái)獲取服務(wù)；普通消費(fèi)…

02-20

王騰告別小米系轉(zhuǎn)用iPhone 17 跨界睡眠健康賽道引關(guān)注

快科技2月20日消息，原小米中國(guó)區(qū)市場(chǎng)部總經(jīng)理、REDMI品牌總經(jīng)理，現(xiàn)任今日宜休科技創(chuàng)始人王騰的一條微博，意外引發(fā)數(shù)碼圈熱議。其分享睡眠質(zhì)量改善的內(nèi)容，發(fā)布設(shè)備顯示為iPhone 17，這也是他自2025…

02-20

3999元！amazfit T-Rex Ultra 2戶外旗艦表發(fā)布：雙頻定位最長(zhǎng)177小時(shí)續(xù)航

快科技2月20日消息，今天amazfit全球同步發(fā)布全新戶外旗艦手表T-Rex Ultra 2，其在續(xù)航、導(dǎo)航、戶外安全三大方面進(jìn)行了升級(jí)。T-Rex Ultra 2采用1.5英寸AMOLED顯示屏，搭配藍(lán)…

02-20

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競(jìng)爭(zhēng)格局或迎新變局

谷歌近日正式發(fā)布了其最新的人工智能模型——Gemini 3.1Pro，這一版本的推理能力相比前作翻倍，達(dá)到了77.1%的ARC-AGI-2基準(zhǔn)得分，標(biāo)志著谷歌在AI領(lǐng)域的又一次重大突破。此外，Gemin…

02-20

點(diǎn)擊查看更多 +

全站最新

特斯拉Cybercab下線：無(wú)方向盤(pán)踏板設(shè)計(jì)，定價(jià)約20萬(wàn)主打無(wú)人商用出行

本田ICON e輕便電動(dòng)摩托車登場(chǎng)：16歲可騎，續(xù)航81公里還支持換電

2026款?yuàn)W迪RS5來(lái)襲！630馬力插混系統(tǒng) 性能升級(jí)能否征服車迷？

科技賦能新春歸途：智慧加能站讓返鄉(xiāng)之路更高效暖心又便捷

零跑D99內(nèi)飾首曝：極簡(jiǎn)設(shè)計(jì)配懸浮雙屏，增程純電雙動(dòng)力可選

特斯拉Cybercab下線：無(wú)方向盤(pán)踏板設(shè)計(jì)，商用定價(jià)親民，或重塑出行格局

熱門(mén)內(nèi)容

本欄最新

特斯拉Cybercab下線：無(wú)方向盤(pán)踏板后視鏡，專為Robotaxi服務(wù)而生

谷歌Gemini 3.1 Pro發(fā)布：推理能力躍升，AI競(jìng)爭(zhēng)格局或迎新變局

特斯拉Cybercab正式下線：無(wú)方向盤(pán)踏板后視鏡 4月開(kāi)啟生產(chǎn)

消費(fèi)降級(jí)下年輕人如何選車？博越L憑均衡實(shí)力成燃油SUV“黑馬”

特斯拉調(diào)整Cybertruck策略：推59990美元入門(mén)款，頂配“野獸版”降價(jià)回漲前水平

春晚機(jī)器人“組團(tuán)”引爆消費(fèi)熱潮，抖音電商助力科技好物走進(jìn)千家萬(wàn)戶

本網(wǎng)站LOGO小熊標(biāo)志受版權(quán)保護(hù)，版權(quán)登記號(hào)：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴(yán)禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無(wú)障礙技術(shù)由太陽(yáng)灣捐增，為閱讀障礙用戶提供內(nèi)容聽(tīng)讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請(qǐng)通知我們及時(shí)刪除。
中國(guó)（山東）自由貿(mào)易試驗(yàn)區(qū) 魯ICP備11015305號(hào)-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

智譜創(chuàng)始人唐杰：2026年AI for Science迎爆發(fā)，智譜專注創(chuàng)新謀突破

智譜創(chuàng)始人唐杰：2026年AI for Science迎爆發(fā)，智譜專注創(chuàng)新謀突破