字節(jié)跳動(dòng)旗下豆包大模型迎來重要升級(jí),正式邁入2.0階段。此次升級(jí)推出的系統(tǒng)性版本,不僅在性能上與GPT-5.2、Gemini 3 Pro等國際頂尖模型持平,更在成本控制上取得突破性進(jìn)展,將推理成本降低約一個(gè)數(shù)量級(jí),為復(fù)雜任務(wù)的大規(guī)模應(yīng)用提供了更具性價(jià)比的解決方案。
豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型及專用Code模型。其中,旗艦版豆包2.0 Pro在視覺理解、數(shù)學(xué)推理、編程能力等核心指標(biāo)上表現(xiàn)卓越。在多數(shù)視覺基準(zhǔn)測(cè)試中,該模型達(dá)到行業(yè)最高水平;在數(shù)學(xué)奧賽IMO、CMO及編程競(jìng)賽ICPC中均斬獲金牌,甚至在HealthBench醫(yī)療基準(zhǔn)測(cè)試中超越所有競(jìng)品奪得第一。這些成績(jī)證明其已具備與國際頂尖模型正面競(jìng)爭(zhēng)的實(shí)力。
多模態(tài)能力的全面升級(jí)是本次迭代的重點(diǎn)。豆包2.0在動(dòng)態(tài)場(chǎng)景理解、長(zhǎng)視頻分析等任務(wù)中表現(xiàn)突出。在TVBench測(cè)評(píng)中領(lǐng)先其他模型,在EgoTempo基準(zhǔn)測(cè)試中得分甚至超過人類平均水平,展現(xiàn)出對(duì)動(dòng)作、節(jié)奏等動(dòng)態(tài)信息的精準(zhǔn)捕捉能力。長(zhǎng)視頻場(chǎng)景下,該模型在流式實(shí)時(shí)問答測(cè)試中表現(xiàn)優(yōu)異,可支持健身指導(dǎo)、穿搭建議等實(shí)時(shí)交互場(chǎng)景,實(shí)現(xiàn)從被動(dòng)應(yīng)答到主動(dòng)指導(dǎo)的服務(wù)升級(jí)。
成本優(yōu)勢(shì)成為豆包2.0的核心競(jìng)爭(zhēng)力。字節(jié)跳動(dòng)透露,在保持同等性能的前提下,其token定價(jià)較行業(yè)平均水平降低約90%。這一突破在大規(guī)模推理和長(zhǎng)鏈路生成場(chǎng)景中意義重大,例如基于OpenClaw框架構(gòu)建的飛書智能客服Agent,可通過調(diào)用不同技能完成復(fù)雜對(duì)話流程,在遇到難題時(shí)自動(dòng)拉群求助真人客服,并能協(xié)調(diào)上門維修、售后回訪等全流程服務(wù),顯著降低企業(yè)運(yùn)營成本。
專用Code模型為開發(fā)者帶來效率革命。該模型針對(duì)編程場(chǎng)景優(yōu)化后,代碼庫解讀和應(yīng)用生成能力大幅提升,同時(shí)在Agent工作流中強(qiáng)化了糾錯(cuò)機(jī)制。在TRAE編程平臺(tái)的實(shí)測(cè)中,開發(fā)者僅需5輪提示詞即可完成包含11個(gè)AI驅(qū)動(dòng)NPC的互動(dòng)項(xiàng)目開發(fā),這些虛擬角色能自主聊天、招呼顧客甚至砍價(jià),AI游客也會(huì)根據(jù)設(shè)定自主決策行動(dòng)路線。相關(guān)代碼和素材已在GitHub開源,供全球開發(fā)者參考測(cè)試。
目前,豆包2.0 Pro已通過豆包App、電腦端和網(wǎng)頁版向個(gè)人用戶開放"專家"模式,企業(yè)和開發(fā)者可通過火山引擎API服務(wù)接入全系列模型。這種雙軌并行的策略,既滿足了普通用戶的個(gè)性化需求,也為行業(yè)客戶提供了定制化解決方案,標(biāo)志著字節(jié)跳動(dòng)在大模型商業(yè)化道路上邁出關(guān)鍵一步。









