在人工智能蓬勃發(fā)展的當(dāng)下,數(shù)據(jù)已成為驅(qū)動(dòng)企業(yè)創(chuàng)新與轉(zhuǎn)型的核心要素。如何高效治理數(shù)據(jù)、釋放AI潛力,成為企業(yè)數(shù)智化升級(jí)的關(guān)鍵命題。亞馬遜云科技成長(zhǎng)型企業(yè)及新興業(yè)務(wù)總經(jīng)理倪殿令在近期媒體溝通會(huì)上,通過生動(dòng)的比喻揭示了數(shù)據(jù)治理在AI應(yīng)用中的底層邏輯,引發(fā)行業(yè)關(guān)注。

倪殿令將AI數(shù)據(jù)處理流程比作餐館運(yùn)營(yíng):農(nóng)場(chǎng)運(yùn)來(lái)的食材需經(jīng)清洗、分類、切配(對(duì)應(yīng)Amazon EMR服務(wù)),處理后的食材按類別存入冰箱(向量數(shù)據(jù)庫(kù)如Amazon Aurora、Amazon RDS),當(dāng)顧客點(diǎn)餐時(shí)(AI查詢請(qǐng)求),廚師從冰箱取材烹飪(模型調(diào)用與計(jì)算)。他強(qiáng)調(diào):"AI應(yīng)用的性能90%取決于底層數(shù)據(jù)處理能力。企業(yè)能否駕馭生成式AI,核心在于數(shù)據(jù)規(guī)模與質(zhì)量,而非前端模型或應(yīng)用界面。"
針對(duì)企業(yè)落地AI的實(shí)踐路徑,倪殿令提出"黃金三角"方法論:首先需精準(zhǔn)定位高價(jià)值業(yè)務(wù)場(chǎng)景,如智能客服、知識(shí)庫(kù)構(gòu)建等,明確輸入輸出標(biāo)準(zhǔn);其次要構(gòu)建結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ),通過數(shù)據(jù)治理工具實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)向向量的轉(zhuǎn)化;最后需配備數(shù)據(jù)工程師、算法工程師等專業(yè)人才,完成模型適配與調(diào)優(yōu)。他特別指出:"開源模型如同通用教材,企業(yè)需通過微調(diào)(Fine-tuning)注入行業(yè)知識(shí),通過蒸餾技術(shù)提煉關(guān)鍵能力,才能形成差異化競(jìng)爭(zhēng)力。"

據(jù)技術(shù)白皮書顯示,亞馬遜云科技的數(shù)據(jù)治理方案已形成完整閉環(huán):從數(shù)據(jù)采集階段的EMR治理,到存儲(chǔ)層的向量數(shù)據(jù)庫(kù)支持,再到應(yīng)用層的RAG增強(qiáng)檢索架構(gòu),覆蓋了AI全生命周期。這種技術(shù)積累使其在IDC最新評(píng)估中位列中國(guó)生成式AI數(shù)據(jù)基礎(chǔ)設(shè)施市場(chǎng)領(lǐng)導(dǎo)者象限,其服務(wù)已助力多家企業(yè)實(shí)現(xiàn)查詢響應(yīng)速度提升60%、模型幻覺率降低40%的顯著效果。
當(dāng)前,數(shù)據(jù)治理正從后臺(tái)支持角色轉(zhuǎn)向戰(zhàn)略核心。隨著企業(yè)AI應(yīng)用從試點(diǎn)走向規(guī)模化,如何平衡數(shù)據(jù)安全與利用效率、如何構(gòu)建跨部門數(shù)據(jù)協(xié)作機(jī)制,將成為下一階段競(jìng)爭(zhēng)焦點(diǎn)。亞馬遜云科技的實(shí)踐表明,只有筑牢數(shù)據(jù)根基,才能讓AI技術(shù)真正轉(zhuǎn)化為商業(yè)價(jià)值。












