滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

新加坡國立大學領銜突破：AI視覺記憶雙系統，讓機器“看”圖更懂“憶”

時間：2026-01-16 01:53:05 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

新加坡國立大學人工智能研究團隊攜手復旦大學、清華大學、浙江大學、中國科學技術大學及vivo公司專家，在視覺記憶領域取得重大突破。他們開發的VisMem框架首次將人類認知心理學中的雙記憶系統理論應用于人工智能，使AI在復雜視覺任務中的性能平均提升11.8%。這項成果發表于權威學術平臺，為解決AI視覺處理中的"健忘癥"問題提供了創新方案。

傳統AI視覺模型在處理多步驟推理或長文本生成任務時，常出現"視覺健忘癥"現象。研究團隊形象地比喻道：這就像學生在解題時，起初能清晰記住題目圖表中的數據，但隨著計算過程推進，逐漸依賴草稿紙上的文字記錄，最終忽略原始圖表的關鍵信息。這種缺陷源于現有模型采用的自回歸解碼機制，導致系統在生成回答時過度依賴先前文字內容，而忽視初始視覺輸入。

人類認知機制為破解這一難題提供了靈感。認知心理學研究表明，人類擁有短期視覺記憶和長期語義記憶兩套獨立系統。短期記憶如同臨時儲物柜，忠實記錄當前場景的細節特征；長期記憶則像智能圖書館，儲存抽象概念和背景知識。研究團隊受此啟發，為AI設計了包含記憶調用機制和記憶形成機制的雙重記憶系統。

VisMem框架的創新性體現在其智能記憶管理策略。系統通過新增的四個特殊標記符號實現記憶調用控制，當需要視覺細節時激活短期記憶，進行抽象推理時調用長期記憶。記憶形成機制包含查詢構建器和兩個專用形成器：短期形成器編碼物體形狀、顏色等精確特征，長期形成器提取場景語義和概念關聯。這種設計使AI既能關注細節又能把握整體，顯著提升復雜任務處理能力。

訓練過程采用獨特的兩階段強化學習方法。第一階段專注優化記憶生成質量，通過隨機觸發記憶調用并對比性能差異，教會系統生成真正有用的記憶內容；第二階段重點訓練記憶調用策略，引入懲罰機制防止無效調用。實驗表明，經過訓練的AI能根據任務需求自適應調整記憶使用模式，在需要精細分析時更多依賴短期記憶，進行抽象推理時則調用長期記憶。

全面實驗驗證了VisMem框架的有效性。研究團隊在12個權威評測基準上進行測試，涵蓋視覺理解、推理和生成三大核心能力。結果顯示，配備雙重記憶系統的AI在所有測試中均表現優異，特別是在需要多步驟推理的任務中，性能提升達16.4%。細分任務分析表明，短期記憶在物體計數等細節識別任務中發揮關鍵作用，長期記憶則為歸納推理等抽象任務提供語義支持。

實際應用場景測試進一步證明了該技術的實用性。在超市購物分析任務中，VisMem系統能準確記憶不同商品的價格信息，同時識別促銷標簽，最終給出精確總價計算。面對多圖片對比分析時，系統可有效保持跨圖片的視覺對應關系，理解場景變化含義。在數學問題求解中，AI能在復雜計算過程中持續引用圖表中的關鍵數值，將錯誤率降低約25%。

這項突破不僅帶來性能提升，更標志著AI設計范式的轉變。傳統方法通過擴大模型規模和增加訓練數據提升能力，而VisMem框架通過借鑒人類認知機制，開辟了新的發展路徑。其展現的跨領域泛化能力和抗遺忘特性，為構建穩定可靠的AI系統提供了新思路。研究團隊指出，這種認知啟發式設計可能推動AI向更智能、更接近人類思維的方向發展。

盡管取得顯著進展，研究人員也客觀分析了當前技術的局限性。計算效率權衡、固定記憶容量、記憶內容可解釋性等問題仍需進一步研究。團隊正在探索輕量化記憶調用機制、動態記憶容量調整和增強系統魯棒性的方法，以期在保持性能優勢的同時降低計算成本，提升技術實用性。

該成果在學術界和產業界引發廣泛關注。專家認為，VisMem框架為解決AI視覺處理的核心難題提供了創新方案，其雙重記憶設計理念可能啟發更多基于人類認知機制的AI架構開發。隨著研究深入，這項技術有望在醫療影像分析、自動駕駛、教育輔導等領域發揮重要作用，推動人工智能向更智能、更可靠的方向邁進。

更多>同類資訊

云知聲港股大漲超70% 2025年大模型業務收入預計同比增超10倍

01-29

中國首個星際航行學院成立，院長揭秘：星際航行未來如何“啟航”？

01-29

培養皿中的“迷你腦”：無身體神經元游戲挑戰，智能新解待探尋

01-29

理想汽車研發架構大調整：自動駕駛團隊拆分，聚焦AI與人形機器人布局

01-29

長城魏牌全新旗艦SUV V9X官宣歸元平臺加持或成大型SUV市場新勢力

01-29

理想調整研發架構，智駕部門將被重組

01-29

惠州發力未來產業：設專門機構推動AI與機器人發展，布局多領域促升級

惠州市市長陳宇航表示，惠州躋身經濟大市行列，肩上是沉甸甸的責任，在“十五五”時期，惠州將從產業、園區和城市空間等三個方面布局發力，為全省大局當好支撐、多作貢獻。陳宇航介紹，目前，惠州石化能源新材料產業規模全…

01-29

具身智能賦能新質生產力北京產學研協同加速機器人技術落地應用

01-29

金庸武學心法啟新思！復旦團隊實現原子層半導體抗輻射通信在軌突破

01-29

上海AI實驗室等聯合研究：讓智能代理既“聰明”又“省錢”的破局之道

A：智能代理的效率問題是指這些AI系統在執行復雜任務時成本會像滾雪球一樣越來越高。與普通大模型一問一答不同，智能代理需要記憶管理、工具使用、任務規劃等多個步驟，每一步的輸出都成為下一步的輸入，導致資源消耗呈…

01-29

博物館講解機器人功率系統優化：MOSFET選型助力高效穩定智慧導覽

本文以系統化、場景化的設計思維，深入剖析博物館講解機器人在功率路徑上的核心挑戰：如何在滿足高可靠性、低噪聲、緊湊空間布局和嚴格功耗控制的多重約束下，為電機驅動、多路功能負載管理及內部電源轉換這三個關鍵節點，…

01-29

宸境科技發布Insight智能相機攜手地瓜機器人推動雙目感知技術規模化落地

2026年1月28日，地瓜機器人生態伙伴宸境科技發布全新LooperRobotics品牌及多款矩陣產品，即由Insight全自主空間智能相機、TinyNav高性能導航算法庫與RoboSpatial空間編輯工具…

01-29

2026款北京越野BJ40燃油巨幕版登場！智能座艙硬核越野，13.29萬起售

01-29

華為乾崑智駕ADS 4、HarmonySpace 5新版本官宣即將推送

01-29

極豆科技汪奕菲展望：汽車智能化加速 2026年開啟汽車Agent新時代

01-29

點擊查看更多 +

全站最新

卡瓦依KDP120GR電鋼琴：專業配置加持，解鎖多元場景音樂新體驗

第八屆“鼎新獎”揭曉：創新企業與產品領航，共繪全球商業新藍圖

青島汽車產業加速轉型：整車產量破百萬，新能源同比激增242.3%

寶馬2月全面換新標：去鍍鉻添啞光細節調整傳遞品牌新質感

長城魏牌全新旗艦SUV V9X官宣歸元平臺加持或成大型SUV市場新勢力

新能源車廢舊動力電池回收有新招！2026年起“車電一體”與數字身份證并行

熱門內容

本欄最新

長城魏牌全新旗艦SUV V9X官宣歸元平臺加持或成大型SUV市場新勢力

2026款北京越野BJ40燃油巨幕版登場！智能座艙硬核越野，13.29萬起售

極豆科技汪奕菲展望：汽車智能化加速 2026年開啟汽車Agent新時代

算法不應筑“回音壁”：打破定制評論區，讓網絡空間多元聲音共存

馬云談AI時代教育變革：重點在于培養孩子好奇心與創意提問能力

鹿明機器人：數據與硬件雙線突進，商業化落地面臨哪些硬仗？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

新加坡國立大學領銜突破：AI視覺記憶雙系統，讓機器“看”圖更懂“憶”