蘋果公司近日公開了去年7月舉辦的“AI推理與規(guī)劃研討會”現(xiàn)場視頻,這場為期兩天的學(xué)術(shù)盛會聚焦人工智能領(lǐng)域三大核心方向:推理與規(guī)劃機制、智能體應(yīng)用場景拓展以及模型開發(fā)技術(shù)突破。會議吸引了來自學(xué)術(shù)界與產(chǎn)業(yè)界的頂尖人才,包括加州大學(xué)洛杉磯分校、斯坦福大學(xué)、加州大學(xué)伯克利分校等高校的研究團隊,與蘋果內(nèi)部工程師共同呈現(xiàn)了近30項前沿研究成果。
在公開的8場核心演講中,蘋果專家團隊系統(tǒng)闡述了從大語言模型到具身智能體的技術(shù)演進路徑,并首次披露了“綜合智能體能力基準(zhǔn)測試”框架。針對大語言模型的推理能力優(yōu)化,研究人員提出了基于強化學(xué)習(xí)的長跨度交互訓(xùn)練方法,通過模擬復(fù)雜場景提升模型決策的連貫性。加州大學(xué)伯克利分校團隊展示的自適應(yīng)并行推理技術(shù),通過動態(tài)分配計算資源顯著提高了模型運行效率。
學(xué)術(shù)界貢獻了多維度突破性研究。圣菲研究所專家針對視覺語言模型提出新型魯棒性評估體系,通過引入對抗樣本訓(xùn)練增強模型抗干擾能力。不列顛哥倫比亞大學(xué)團隊提出的開放式AI生成算法,在基礎(chǔ)模型時代為內(nèi)容創(chuàng)作提供了新的范式。卡內(nèi)基梅隆大學(xué)則展示了面向智能體的互聯(lián)網(wǎng)級訓(xùn)練框架,通過分布式架構(gòu)實現(xiàn)海量數(shù)據(jù)的實時處理。
蘋果工程師在技術(shù)解析環(huán)節(jié)重點介紹了長跨度交互式大語言模型智能體的強化學(xué)習(xí)機制。該技術(shù)通過構(gòu)建多輪對話獎勵模型,使智能體能夠維持跨時段的任務(wù)連貫性,在客戶服務(wù)、教育輔導(dǎo)等場景具有應(yīng)用潛力。此次公開的視頻資料為AI領(lǐng)域研究者提供了珍貴的技術(shù)參考,相關(guān)成果已在arXiv平臺同步發(fā)布技術(shù)論文。











