岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

<dfn id="c0f88"></dfn>

<span id="c0f88"></span>

ITBear科技資訊
手機版
二維碼
內容搜索
無障礙通道
語言：中文 EN

ITBear旗下自媒體矩陣：

滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

蘋果攜手高校推RubiCap新框架：優化AI圖像描述，小參數量模型也有大作為

時間：2026-03-26 08:30:09 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

蘋果公司與威斯康星大學麥迪遜分校近日宣布，雙方聯合研發的AI訓練框架RubiCap正式問世。該框架聚焦于優化"密集圖像描述"模型的訓練效率，通過創新機制解決了傳統方法中人工標注成本高、合成數據多樣性不足等核心問題。

作為計算機視覺領域的前沿技術，密集圖像描述技術突破了傳統圖像標注僅提供整體描述的局限。該技術能夠精準識別圖像中的局部區域，例如"窗臺上的綠植"或"街道上奔跑的寵物犬"，并為每個細節生成符合語境的文字說明。這種能力在視覺語言模型訓練、文本生成圖像以及輔助工具開發等領域具有重要應用價值。

研究團隊針對現有訓練方法的缺陷，構建了新型強化學習系統。該系統首先從專業數據集中篩選5萬張圖像，調用GPT-5、Gemini 2.5 Pro等大模型生成初始描述。隨后通過Gemini 2.5 Pro分析不同模型的輸出結果，提煉出描述的共識要點與遺漏信息，形成結構化的評分標準。最終由Qwen2.5模型根據這些標準對候選描述進行質量評估，為訓練模型提供精確的改進方向。

基于該框架訓練的RubiCap系列模型包含20億、30億和70億參數三個版本。測試數據顯示，70億參數模型在盲測中表現最優，其"幻覺"錯誤率顯著低于參數量達720億的同類大模型。更引人注目的是，30億參數的輕量級模型在特定測試場景中甚至超越了70億參數版本，證明圖像描述質量與模型參數量之間不存在絕對正相關關系。

這種創新訓練方式不僅降低了數據標注成本，更通過結構化反饋機制提升了模型的學習效率。研究人員表示，該框架為開發高效、精準的視覺語言模型提供了全新范式，特別適用于需要快速部署的移動端應用場景。

更多>同類資訊

速騰聚創2025年成績亮眼：首季盈利全年營收創新高機器人業務爆發

03-26

全場景覆蓋漢王智能辦公本助力2026中關村論壇無紙化辦會

03-26

月薪高達6萬！“龍蝦官”成新寵，大模型時代催生職場新機遇

03-26

華為起訴迪士尼背后：HEVC專利布局深厚，技術實力再引關注

03-26

漢王科技以智能辦公本賦能2026中關村論壇開啟無紙化高效會務新體驗

03-26

哈佛教授實驗揭秘：AI研究生科研效率驚人，學術造假卻成致命短板

03-26

消費信號重構賽道：2025新銳品牌如何借搜索坐標破局增長？

03-26

雙林股份2025年凈利潤微增，轉型布局新興領域謀發展新機遇

03-26

融資3億美金的愛詩科技：破技術門檻建全場景矩陣，深耕行業不止于賣Token

愛詩科技在2023年入場，是全球最早深耕視頻大模型賽道的團隊之一。截至目前，愛詩科技已穩居全球視頻生成模型的第一梯隊孫偉哲在現場透露，愛詩科技已經進化為一個“模型工廠”，以每兩三個月一次的頻率極速迭代。目…

03-26

國家數據局局長權威解讀：Token“詞元”成AI價值錨點，我國調用量飆升

在中國發展高層論壇2026年年會上，國家數據局局長劉烈宏表示，Token“詞元”不僅是智能時代的價值錨點，更是連接技術供給與商業需求的“結算單位”，為商業模式的落地提供了可量化的可能；也從官方角度上為Toke…

03-26

靈境萬維武漢公司成立，布局AI領域，旗下多家新公司同步啟航

天眼查App顯示，靈境萬維（武漢）智能科技有限公司成立于2025年1月，法定代表人為許金城，注冊資本100萬人民幣，經營范圍包括人工智能應用軟件開發、人工智能基礎軟件開發、人工智能通用應用系統等，由靈境萬維（…

03-26

英偉達黃仁勛談AI：白領藍領皆受影響，主動擁抱AI方能立足未來

來源：環球網【環球網科技綜合報道】3月25日消息，據外媒Business Insider報道，近日，英偉達CEO黃仁勛在播客節目中表示，人工智能的影響不僅局限于辦公室白領，藍領工人也需高度關注，建議各行業…

03-26

2026中關村論壇人工智能主題日啟幕三大亮點解鎖AI前沿新體驗

其中，AI未來論壇將邀請國際頂尖嘉賓及知名投資人、產業領袖，圍繞“躍遷·投資·共生”主題探討AI技術到價值的躍遷；中關村學院全球對話將發布學院成立以來最新開源技術成果，探討人工智能+教育科技人才一體化發展的未…

03-26

解鎖AI“基礎語言單位”：一文讀懂詞元在大模型中的核心作用與換算邏輯

AI 不會直接看懂整句話，而是把內容拆成一個個詞元，再進行計算、理解和生成，既是計量單位，也是計價單位，還是計算的基本單位。我們平時說話寫字用的是字、詞、句子，但 AI “認字” 的方式不一樣 —— 它會通…

03-26

“龍泉三號”“龍泉四號”下線，億緯鋰能助力成都新能源產業騰飛

從應用場景和具體性能來看，“龍泉三號”全固態電池主要面向消費領域，可以在2MPa以下工作，特點是高體積能量密度；“龍泉四號”全固態電池主要面向動力領域，容量提升至60Ah，目前可以在≤5MPa壓力下循環，初…

03-26

點擊查看更多 +

全站最新

美股三大指數集體收漲，AMD、英特爾漲超7%，中概指數漲1.86%

亞馬遜收購福納機器人，拓展服務場景，機器人布局再升級

谷歌Android Automotive系統升級：深入汽車“大腦” 與蘋果CarPlay展開激烈角逐

林里檸檬茶王敬源：AI應用先聚焦核心，從產品與門店模型破局

華中科技大學與字節跳動攜手：深度混合注意力機制為AI發展注入新動力

小米18系列將全球首發！高通驍龍8E6雙芯齊發 2nm工藝引領性能新高度

熱門內容

本欄最新

新款邁巴赫S級來襲：氣場升級科技感拉滿，燃油車也能玩轉潮流新高度

易點天下2025年營收38.3億增50%：多業務增長，客戶矩陣覆蓋全球超萬家

臥安機器人2025財報：營收9億增47.7% 虧損擴大但經調整凈利有提升

至臻新境禮遇巔峰新一代梅賽德斯 - 邁巴赫S級轎車全球耀世登場

中建材信息閃耀華為中國合作伙伴大會2026 斬獲殊榮共繪數智新藍圖

華為打造廣州白云智慧樞紐樣板：站城融合引領全球城軌數智化新潮流

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.