近日,AI數(shù)據(jù)公司曼孚科技宣布完成數(shù)億元Pre-C輪融資。本輪融資由五源資本領(lǐng)投,同創(chuàng)偉業(yè)、招銀鼎洪跟投。本輪資金將主要用于公司核心技術(shù)平臺(tái)建設(shè),包括AI數(shù)據(jù)生成平臺(tái),Agent平臺(tái),自有eval體系等。公司致力于構(gòu)建完善的AI數(shù)據(jù)生產(chǎn)與評(píng)測(cè)系統(tǒng),打造AI數(shù)據(jù)產(chǎn)業(yè)的臺(tái)積電。
人工智能正在以前所未有的速度改變世界,當(dāng)大模型的能力呈指數(shù)級(jí)躍遷,AI產(chǎn)業(yè)的競(jìng)爭(zhēng)焦點(diǎn),也正在悄然發(fā)生變化。如果說(shuō)過(guò)去十年,AI產(chǎn)業(yè)的核心在算法與算力;那么未來(lái)十年,數(shù)據(jù)質(zhì)量、反饋質(zhì)量與評(píng)測(cè)體系,將成為決定AI上限的重要要素。一個(gè)新的產(chǎn)業(yè)形態(tài)正在誕生——AI數(shù)據(jù)生產(chǎn)與評(píng)測(cè)系統(tǒng)。正如半導(dǎo)體制造從IDM模式升級(jí)為純晶圓代工模式,AI數(shù)據(jù)行業(yè)也正在從傳統(tǒng)“數(shù)據(jù)標(biāo)注”,走向更復(fù)雜、更工程化的數(shù)據(jù)生產(chǎn)與評(píng)測(cè)體系。
一、AI數(shù)據(jù)產(chǎn)業(yè)的必然升級(jí):從富士康到臺(tái)積電
在電子工業(yè)時(shí)代,富士康代表的是規(guī)模化制造能力。而臺(tái)積電代表的,則是先進(jìn)制造能力和芯片評(píng)測(cè)體系。
今天的AI數(shù)據(jù)產(chǎn)業(yè),正處在類(lèi)似的歷史拐點(diǎn)。
傳統(tǒng)的數(shù)據(jù)標(biāo)注公司,更像是AI時(shí)代的“富士康”——通過(guò)人力規(guī)模化完成基礎(chǔ)的數(shù)據(jù)生產(chǎn)。
而未來(lái)真正的AI數(shù)據(jù)企業(yè),將更像是“臺(tái)積電”:它們不只是提供人力,而是構(gòu)建更完整的數(shù)據(jù)生產(chǎn)、反饋和評(píng)測(cè)能力,包括但不限于:
· 面向監(jiān)督微調(diào)(SFT)的高質(zhì)量訓(xùn)練數(shù)據(jù)
· 面向強(qiáng)化學(xué)習(xí)與偏好優(yōu)化的數(shù)據(jù)生產(chǎn)(RLHF/Preference Data)
· 面向Agent能力提升的軌跡數(shù)據(jù)、環(huán)境數(shù)據(jù)與評(píng)測(cè)數(shù)據(jù)
· 面向復(fù)雜場(chǎng)景的專(zhuān)業(yè)領(lǐng)域數(shù)據(jù)與專(zhuān)家反饋
· 面向模型迭代的人機(jī)協(xié)同評(píng)測(cè)與質(zhì)量控制體系等等
為了應(yīng)對(duì)這一趨勢(shì),曼孚科技研發(fā)了以下各大平臺(tái),包括:
· AI數(shù)據(jù)生成&合成平臺(tái)(涵蓋各類(lèi)RL環(huán)境等)
· General Agent平臺(tái)(支持復(fù)雜長(zhǎng)程任務(wù)規(guī)劃與執(zhí)行)
· 自有eval體系(支持快速驗(yàn)證model/agent在非公開(kāi)benchmark上的表現(xiàn))
依托上述平臺(tái),曼孚實(shí)現(xiàn)了工業(yè)級(jí)、體系化、可規(guī)模復(fù)制的數(shù)據(jù)制造和評(píng)測(cè)能力,為大模型的迭代升級(jí)提供有力的支持。
二、Token:AI時(shí)代的“電力消耗”,曼孚千億日耗詮釋AI時(shí)代生產(chǎn)力
在AI時(shí)代,一個(gè)公司的技術(shù)實(shí)力,不再只看模型參數(shù),而要看Token消耗量。
Token,正在成為AI時(shí)代最真實(shí)的生產(chǎn)指標(biāo)。就像電力消耗代表工業(yè)規(guī)模,算力消耗代表互聯(lián)網(wǎng)規(guī)模。Token消耗,則代表AI生產(chǎn)力。
目前,曼孚科技的日Token消耗量已達(dá)到千億級(jí)別。
這意味著:曼孚不僅是一家AI數(shù)據(jù)公司,更是一家真正深度融合AI的平臺(tái)型公司。
因?yàn)橹挥姓嬲袮I深度融入生產(chǎn)流程的企業(yè),才會(huì)產(chǎn)生如此規(guī)模的Token消耗。
三、萬(wàn)億美金的大模型公司VS千億美金的AI數(shù)據(jù)公司
今天,全球科技產(chǎn)業(yè)正處在新的臨界點(diǎn)。萬(wàn)億美金級(jí)的大模型巨頭(OpenAI)已立于潮頭。 而在這些公司背后,一個(gè)同樣巨大的產(chǎn)業(yè)也正在崛起——AI數(shù)據(jù)產(chǎn)業(yè)。
如果說(shuō)算力是AI的發(fā)動(dòng)機(jī),算法是AI的操作系統(tǒng),那么數(shù)據(jù),就是AI的燃料。
未來(lái)的AI競(jìng)爭(zhēng),本質(zhì)上就是:誰(shuí)擁有更領(lǐng)先的數(shù)據(jù)生產(chǎn)與評(píng)測(cè)能力。
因此,在萬(wàn)億美金的大模型巨頭背后,千億美金級(jí)的AI數(shù)據(jù)公司,也必將應(yīng)運(yùn)而生。
正是在這樣的產(chǎn)業(yè)趨勢(shì)之下,曼孚科技正在積極構(gòu)建面向大模型時(shí)代的AI數(shù)據(jù)基礎(chǔ)設(shè)施。
在未來(lái)的AI產(chǎn)業(yè)鏈中,大模型公司負(fù)責(zé)模型創(chuàng)新,算力公司提供計(jì)算基礎(chǔ)設(shè)施,而像曼孚科技這樣的企業(yè),將成為AI時(shí)代數(shù)據(jù)基礎(chǔ)設(shè)施的提供者。
未來(lái)十年,AI產(chǎn)業(yè)的競(jìng)爭(zhēng)將不再只是模型參數(shù)的競(jìng)爭(zhēng),算力規(guī)模的競(jìng)爭(zhēng);更是AI數(shù)據(jù)生產(chǎn)與評(píng)測(cè)體系的競(jìng)爭(zhēng)。誰(shuí)能夠構(gòu)建先進(jìn)AI數(shù)據(jù)生產(chǎn)與評(píng)測(cè)體系,誰(shuí)就能夠成為AI時(shí)代的關(guān)鍵基礎(chǔ)設(shè)施,正如臺(tái)積電之于半導(dǎo)體產(chǎn)業(yè)。而曼孚科技的目標(biāo),正是成為AI數(shù)據(jù)產(chǎn)業(yè)的臺(tái)積電。











