阿里巴巴正式推出其最新旗艦推理模型——千問Qwen3-Max-Thinking,標志著公司在人工智能領域邁出重要一步。這款模型擁有超過萬億參數,預訓練數據量達到36T Tokens,是目前阿里旗下規模最大、性能最強的推理模型,為開發者、企業和普通用戶提供了強大的智能支持。
開發者可通過QwenChat平臺免費體驗這一新模型,企業用戶則能借助阿里云百煉獲取API服務。千問PC端和網頁端也已開放試用,千問APP也即將接入該模型,屆時所有用戶均可免費體驗其強大功能。這一舉措進一步降低了大模型的使用門檻,推動了AI技術的普及。
在性能方面,Qwen3-Max-Thinking表現尤為突出。預覽版模型已在數學推理領域取得突破,斬獲AIME 25和HMMT 25國內首個雙滿分。正式版模型在此基礎上進行了更大規模的強化學習后訓練,性能得到全面提升。其采用的測試時擴展機制,通過“經驗提取”和多輪自我迭代,實現了更高效的推理計算,避免了傳統方法中冗余推理的問題,顯著提升了推理效率和結果質量。
在“人類最后的測試”HLE中,Qwen3-Max-Thinking以58.3分的成績超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,創下當前所有模型的最高分。這一成績充分證明了其在復雜推理任務中的卓越能力,為智能體Agent時代的應用奠定了堅實基礎。
面向未來,Qwen3-Max-Thinking還大幅增強了自主調用工具的原生Agent能力,使其能夠更靈活地應對多樣化場景需求。這一改進不僅提升了模型的實用性,也為智能體技術的發展提供了新的方向。
在應用拓展方面,千問大模型已邁出重要一步。2025年11月,國星宇航成功將千問Qwen3大模型部署至“星算”計劃01組太空計算中心,實現了全球首次通用大模型在軌運行。該模型在太空中成功完成多次端到端推理任務,從地面接收問題,在衛星上完成推理,并將結果回傳地面,全程耗時不到2分鐘。這一突破為太空計算和智能應用開辟了新的可能性。
在開源領域,千問系列模型同樣表現亮眼。全球最大AI開源社區Hugging Face數據顯示,阿里千問衍生模型數量已突破20萬個,成為全球首個達成此目標的開源大模型。同時,千問系列模型下載量超過10億次,日均下載量達110萬次,全面超越美國Llama模型,穩居開源大模型全球第一。這一成就不僅體現了千問模型的廣泛影響力,也彰顯了中國在人工智能開源領域的領先地位。










