在云計算領域,將工作負載從一個云平臺遷移至另一個云平臺一直是企業面臨的棘手挑戰。盡管Terraform作為基礎設施即代碼技術的標準,本應助力基礎設施在云提供商間實現可移植性,但現實卻不盡如人意。每個云提供商都擁有獨特的資源表述方式,導致遷移過程往往需要數月的手動重寫代碼。即便市面上存在一些聲稱能生成生產就緒基礎設施即代碼的AI工具,在處理網絡、身份訪問管理以及服務依賴等復雜問題時,表現也難以令人滿意。
位于加利福尼亞州普萊森頓的初創公司FluidCloud,在2025年7月獲得810萬美元種子輪融資后正式走出隱身模式,推出了一項名為大型基礎設施模型的創新技術。該技術是一個專門打造的AI引擎,專注于在多云環境中生成、翻譯和驗證Terraform代碼。FluidCloud聯合創始人兼首席執行官Sharad Kumar強調,真正的彈性并非僅僅掃描云環境并生成基礎設施即代碼,而是具備將基礎設施遷移至其他區域或云提供商的能力。
大型基礎設施模型在架構設計上獨樹一幟。與大多數基于基礎模型或標準微調大語言模型構建的AI基礎設施工具不同,它采用了多個模型的混合架構。聯合創始人兼首席技術官Harshit Omar介紹,系統的轉換和核心能力并非依賴大語言模型,而是基于他們自主研發的條件模型。其中,標準大語言模型位于前端,負責解析用戶意圖;Terraform生成和云到云轉換工作則運行在基于基礎設施模式訓練的自定義基礎模型上。這些訓練數據全部為合成數據,FluidCloud通過生成大量Terraform配置,并運用自身轉換技術構建了訓練語料庫。
在性能評估方面,FluidCloud采用BLEU評分對大型基礎設施模型進行基準測試。目前,該模型得分為0.58,接近0.60的人類水平性能,顯示出其在Terraform生成任務上的出色表現。該模型覆蓋跨云提供商的150多種資源類型,輸入模型也發生了顯著變化。此前,平臺需要直接云掃描作為輸入,且僅覆蓋約25到30種資源類型;如今,它接受包含Terraform代碼的現有GitHub存儲庫作為輸入,能夠處理多種Terraform語法樣式,并支持自定義映射覆蓋。
大型基礎設施模型還具備多項擴展功能。在遷移開始前,它會運行兼容性評分層,根據現有基礎設施估計在目標平臺上可能失敗的工作負載百分比。同時,該模型引入了故障預測功能,通過分析云提供商發布周期、區域間公共網絡延遲數據和計劃的操作系統升級窗口等信息,預測潛在故障。FluidCloud計劃建立一個公共社區頁面,發布即將到來的故障預測,供企業訂閱提前通知。平臺開箱即用包含1800個合規策略,涵蓋主要超大規模云服務商以及Vultr、OVH和Hetzner等新興云提供商。
跨云網絡遷移是多云遷移中的一大難題。不同云提供商在VPC配置、私有隧道、安全組和防火墻規則等方面的表述方式各異,手動遷移這些配置往往導致遷移過程停滯。大型基礎設施模型在翻譯基礎設施時,能夠完整復制網絡堆棧,確保在另一個云中實現功能一致。由于該模型在跨提供商DevOps和基礎設施模式上進行了訓練,因此無需工程團隊從頭學習每個云的網絡方言,即可高效處理翻譯工作。
除了遷移功能,大型基礎設施模型還充當優化層。Harshit Omar解釋,DevOps工程師做出的每個基礎設施變更都可歸為成本、安全或性能三類。該模型對這些變量進行建模,并根據檢測到的意圖設置權重,從而生成新的基礎設施配置。例如,如果用戶意圖降低成本,模型會平衡配置以實現這一目標;如果用戶關注性能提升,模型則會優化配置以提高性能。
在故障預測方面,Harshit Omar指出,上游光纖提供商并非云故障的主要因素,發布周期壓力才是更大驅動因素。由于云提供商面臨提供更新服務的壓力,加上AI和代碼生成技術的應用,質量控制和故障問題日益增多。針對這一現狀,FluidCloud的下一個開發重點包括用于通過MCP創建自定義基礎設施工作流的智能體構建器,以及抽象云提供商API的可移植SDK。這些SDK將使切換云部署變得如同更改環境變量一樣簡單,無需重寫API調用。











