商湯科技近日宣布推出一款名為“美顏Agent”的智能美顏解決方案,將AI模型的分析決策能力與成熟的美顏SDK執行體系深度融合,為用戶提供基于自然語言交互的圖像與視頻美化服務。該產品通過簡化操作流程,實現了從參數調整到智能決策的技術跨越。
在功能實現上,用戶僅需輸入自然語言描述即可完成復雜的美顏需求,例如調整膚色均勻度、優化面部比例或切換妝效風格。系統通過實時分析人臉特征、膚質狀態及使用場景,自動生成個性化美化策略,并調用底層算法執行處理,大幅減少傳統手動調參的繁瑣步驟。這種設計使得非專業用戶也能輕松獲得專業級修圖效果。
技術架構采用“AI決策+SDK執行”的協同模式。其中AI模塊負責解析用戶意圖與場景適配,通過語義理解技術將自然語言轉化為可執行指令;SenseAR SDK則承擔具體效果落地,涵蓋磨皮、輪廓塑形、智能濾鏡等核心功能。商湯科技強調,這種分層架構既保證了智能化決策的準確性,又通過SDK的成熟技術維持了效果穩定性,有效避免了純生成式處理可能導致的畫面失真問題。
執行層面依托的SenseAR SDK已在全球范圍內實現規模化商用,累計覆蓋數十億終端設備。該SDK經過長期市場驗證,具備跨平臺兼容性和高穩定性特點,為美顏Agent的廣泛落地提供了技術保障。官方數據顯示,其底層算法在動態場景下的處理延遲低于50毫秒,能夠滿足實時美顏需求。
產品功能矩陣包含一鍵美顏、智能濾鏡推薦、風格化妝效、面部緊致提升等核心能力,并支持與特效引擎聯動實現互動式修圖。例如在視頻直播場景中,主播可通過語音指令實時切換美顏模式;在線教育領域則可自動優化教師形象,提升畫面專業度。目前該解決方案已適配手機原生相機、美顏類APP、短視頻平臺及部分智能硬件設備。
商湯科技相關負責人表示,美顏Agent的推出標志著行業從參數驅動向智能決策的范式轉變。通過自然語言交互技術,產品成功降低了專業美顏工具的使用門檻,同時其多場景適配能力為開發者提供了更靈活的集成方案。據技術白皮書披露,該系統支持超過200種自然語言指令,并能自動識別中英文混合輸入。











