當人工智能系統走出實驗室,進入浩瀚宇宙這個終極考場,它們能否勝任復雜的太空任務調度?復旦大學計算機科學技術學院聯合上海創新研究院及OpenMOSS團隊完成了一項開創性研究,通過構建虛擬太空考場,讓最先進的AI系統挑戰衛星通信、地球觀測等五大太空任務,揭示了AI在極端環境下的獨特潛力與局限性。
研究團隊打造的"AstroReason-Bench"測試平臺堪稱AI的太空駕考系統。該平臺模擬了真實的太空物理約束,包括衛星軌道動力學、太陽能供電周期、有限數據存儲容量等限制條件。測試包含五大核心挑戰:深空網絡調度需在嚴格時間窗口內協調有限天線資源;重訪優化要求衛星在能源限制下定期監測災害多發區;區域覆蓋任務考驗AI規劃大范圍觀測路徑的能力;立體成像需要精確控制雙角度拍攝時機;延遲優化則模擬衛星網絡中的信號中繼與觀測任務協調。
在為期兩小時的限時考試中,Claude Sonnet 4.5、Gemini 3 Flash等六種前沿大語言模型接受了嚴格測試。這些AI"考生"被賦予查詢衛星狀態、計算軌道位置等工具,但計算資源嚴格限制在16GB內存和8核CPU范圍內。測試結果顯示,AI在需要深度搜索優化的深空網絡調度任務中表現遜于專業算法,不滿足率達0.53-0.59,而混合整數規劃算法僅0.30。但在立體成像等復雜約束任務中,AI展現出驚人優勢,成功規劃出傳統算法完全無法實現的觀測序列,最佳成功率達18%。
研究過程中發現了AI決策的獨特模式。在延遲優化任務中,多數AI執著于尋找能同時觀測兩個地面站的衛星,這種"山頂觀景"思維導致任務失敗。唯有Kat Coder Pro模型創新采用衛星接力中繼方案,通過多顆衛星鏈式傳輸完成通信。區域覆蓋任務則暴露出AI的"行動偏見"——它們往往急于制定計劃而忽視環境分析,導致觀測路徑與軌道嚴重錯配。當研究人員增加"先分析工具再制定策略"的提示后,AI表現顯著提升,開始主動查詢軌道數據優化方案。
與傳統優化算法的對比測試呈現出鮮明差異。貪心算法在重訪優化中因局部最優陷入困境,模擬退火算法通過漸進調整取得較好效果,但在立體成像等復雜任務中全軍覆沒。這種對比揭示:AI在處理非線性約束和復雜關系時具有獨特優勢,而專業算法在明確規則的優化問題上更勝一籌。研究團隊特別設計的"知識增強"實驗顯示,盲目提供學術論文反而干擾AI決策,唯有強制要求制定計劃后查閱資料,才能將AI表現提升5個百分點。
這項研究對商業航天發展具有重要啟示。隨著SpaceX星鏈計劃等項目推動衛星數量爆發式增長,傳統專用算法面臨維護成本高、適應性差等挑戰。AI系統雖在單項性能上不及專業算法,但其通用性和快速學習能力在多任務協調場景中展現獨特價值。例如,現代衛星需同時執行觀測、通信、實驗等多類任務,AI代理可動態調整資源分配,在設備故障等突發情況下快速重構任務計劃。
研究團隊坦言當前工作存在局限性。測試主要基于"閃電級"模型,更大型推理模型可能帶來性能突破;有限的測試場景難以全面反映系統真實能力;專業算法的離線訓練優勢與AI的在線交互限制構成非對稱比較。后續研究將拓展測試范圍至深空軌道規劃等領域,探索專門優化的AI架構,并建立更嚴格的性能評估體系。這項探索不僅為太空任務管理提供新思路,也為城市交通、能源調度等復雜系統優化帶來跨界啟示。











