一場圍繞“信貸多模態(tài)AI如何建立統(tǒng)一標準”的直播討論近日引發(fā)關(guān)注,奇富科技聯(lián)合復(fù)旦大學(xué)、華南理工大學(xué)研究人員共同推出的首個面向信貸場景的多模態(tài)評測基準FCMBench-V1.0成為核心議題。該基準以真實信貸業(yè)務(wù)為根基,覆蓋多模態(tài)感知、推理與決策等關(guān)鍵環(huán)節(jié),同步開源數(shù)據(jù)集與評測工具,旨在為金融AI領(lǐng)域構(gòu)建一套可量化、可對比的評估體系。
奇富科技多模態(tài)負責(zé)人楊葉輝博士在直播中以“鋤頭與土地”作比,指出AI作為工具需與高門檻行業(yè)深度適配。他強調(diào),金融業(yè)務(wù)對隱私、安全與合規(guī)的嚴苛要求,決定了模型能力必須通過客觀標準驗證,而非依賴單一機構(gòu)的自我宣稱。“當前金融機構(gòu)常面臨‘不同模型得分相近卻難以抉擇’的困境,F(xiàn)CMBench的價值在于將所有模型置于同一競技場,在真實業(yè)務(wù)條件下檢驗其推理能力。”楊葉輝透露,該基準在設(shè)計時模擬了光線干擾、角度偏差等十余種真實場景,例如通過職業(yè)信息與資金流水的矛盾識別,檢驗?zāi)P褪欠窬邆浣鹑陲L(fēng)控的核心推理能力。
華南理工大學(xué)許言午教授從跨行業(yè)視角提出,AI在金融領(lǐng)域的滲透遠超公眾認知。他指出,保險定價、資產(chǎn)評估和量化交易等領(lǐng)域早已廣泛應(yīng)用AI技術(shù),只是這些價值隱藏在B端業(yè)務(wù)流程中。對比醫(yī)療AI長達十余年的研發(fā)周期,許言午認為金融行業(yè)更短的迭代周期為模型評測提供了天然土壤。他將數(shù)據(jù)集發(fā)展劃分為三個階段:夯實數(shù)據(jù)質(zhì)量、通過學(xué)術(shù)競賽擴大影響力、最終獲得行業(yè)官方認可。在他看來,F(xiàn)CMBench正站在從第二階段向第三階段跨越的關(guān)鍵節(jié)點。
復(fù)旦大學(xué)陳濤教授從AI發(fā)展史切入,以ImageNet推動計算機視覺領(lǐng)域變革為例,強調(diào)統(tǒng)一評測基準對技術(shù)突破的關(guān)鍵作用。他指出,F(xiàn)CMBench在數(shù)據(jù)規(guī)模、任務(wù)覆蓋度和系統(tǒng)性設(shè)計上已達到國際領(lǐng)先水平,其核心價值在于定義了金融AI的“問題邊界”。“好的數(shù)據(jù)集應(yīng)直接指向行業(yè)痛點,金融AI不能止步于通用模型的微調(diào),而需構(gòu)建內(nèi)生的金融思維鏈,使模型天然理解利率、規(guī)則與風(fēng)險。”陳濤特別提到,學(xué)界與產(chǎn)業(yè)界的協(xié)同至關(guān)重要,F(xiàn)CMBench的開源特性為這種合作提供了基礎(chǔ)框架。
直播主持人、36氪高級內(nèi)容總監(jiān)楊軒在總結(jié)時表示,奇富科技的探索為行業(yè)樹立了標桿,但金融AI的規(guī)范化發(fā)展需要更多機構(gòu)參與數(shù)據(jù)集測試與賽事共建。她呼吁產(chǎn)業(yè)界、學(xué)術(shù)界共同完善這一“金融領(lǐng)域的ImageNet”,通過持續(xù)迭代形成行業(yè)共識,推動技術(shù)從實驗室走向規(guī)模化應(yīng)用。






