滾動資訊

快手全新「檢索數(shù)據(jù)引擎」CroPS 入選AAAI 2026 Oral

時間：2026-01-16 08:58:25 來源：互聯(lián)網(wǎng)編輯：茹茹 IP：北京 發(fā)表評論無障礙通道

短視頻搜索業(yè)務是向量檢索在工業(yè)界最核心的應用場景之一。然而，當前業(yè)界普遍采用的“自強化”訓練范式過度依賴歷史點擊數(shù)據(jù)，導致系統(tǒng)陷入信息繭房，難以召回潛在相關的新鮮內容。針對當前挑戰(zhàn)，快手搜索團隊提出了CroPS框架，從根源上打破數(shù)據(jù)閉環(huán)。目前，CroPS已在快手搜索業(yè)務中實現(xiàn)全量部署，服務億級用戶。

本工作相關成果《CroPS: Improving Dense Retrieval with Cross-Perspective Positive Samples in Short-Video Search》已被人工智能頂級會議AAAI 2026 Oral接收。

為了打破數(shù)據(jù)邊界，CroPS 框架構建了一個包含三個維度的正樣本增強引擎，分別利用用戶換Query行為、推薦系統(tǒng)反饋以及大語言模型(LLM)的世界知識，來全方位地豐富語義空間。圍繞這一目標，CroPS 分別從查詢行為、系統(tǒng)反饋和外部知識三個層面展開。

在真實的搜索場景中，用戶往往難以一次性精準表達意圖。當用戶輸入查詢詞A 卻未能找到滿意結果時，通常會進行查詢重構，輸入語義相關但表述不同的查詢詞B。CroPS 通過分析用戶在短時間窗口內的改寫序列，將改寫后獲得的成功點擊回流給原始查詢，利用用戶的修正行為來糾正模型的語義偏差。

推薦系統(tǒng)擁有海量用戶消費數(shù)據(jù)，其算法機制天然傾向于發(fā)散和探索。CroPS 建立了一套跨系統(tǒng)的信號橋接機制：對于同一個用戶，如果他在推薦信息流中深度消費了某個視頻，且該視頻在語義上與用戶近期的搜索詞高度相關，該視頻就會被引入作為搜索模型的正樣本。

當平臺現(xiàn)有的內容庫或日志無法覆蓋某些長尾、復雜查詢時，CroPS 引入大語言模型(LLM)作為虛擬檢索器和內容生成器，利用 One-shot Prompting 策略生成高質量合成樣本，將外部世界的常識與邏輯蒸餾進檢索模型中。

在多源正樣本被引入之后，如何讓模型有效利用這些信號，同樣成為訓練階段的關鍵。HLA 的核心是解決 CroPS 多源正樣本的可靠性差異問題，通過為樣本分配分層標簽，讓模型能夠學習更細粒度的相關性。H-InfoNCE 在訓練時，將當前樣本與標簽嚴格低于它的所有樣本進行對比，使學習目標與 HLA 的層級邏輯完全對齊。

這一系列設計共同構成了 CroPS 在工業(yè)檢索場景中的完整解決方案。CroPS 證明了在工業(yè)檢索系統(tǒng)中，正樣本增強是緩解信息繭房問題的有效鑰匙。未來，快手搜索團隊將進一步探索 CroPS 與生成式檢索(Generative Retrieval)方法的融合，持續(xù)挖掘大規(guī)模語言模型在搜索全鏈路中的潛力。

更多>同類資訊

Meta Q4營收超預期，加碼AI布局，股價盤后漲超6%獲資本認可

01-29

Chrome瀏覽器煥新升級：Gemini 3賦能開啟“數(shù)字全能管家”新體驗

01-29

螞蟻靈波科技開源LingBot-World世界模型，為具身智能訓練提供新利器

01-29

ServiceNow攜手Anthropic：Claude賦能，共筑企業(yè)AI應用新生態(tài)

01-29

Meta2026年豪擲千億加碼AI：廣告業(yè)務成堅實后盾，資本看好股價上揚

01-29

從商界到講臺：馬云七年堅守初心，AI助力鄉(xiāng)村教育開啟新篇章

01-29

太空光伏與算力結合：光伏產業(yè)迎新機遇，太空能源未來可期？

相關企業(yè)提出計劃在三年內建設總計200GW太陽能制造產能，同時描繪了太空光伏與太空算力結合的遠景藍圖。這一構想不僅為正處于產能過剩困境中的光伏產業(yè)注入了新的想象空間，更可能重新定義未來能源與計算資源的分布方式…

01-29

科創(chuàng)板人工智能ETF（588930）午間微跌0.55% 成交額超六千萬重倉股表現(xiàn)分化

來源：新浪基金∞工作室 1月29日，截止午間收盤，科創(chuàng)板人工智能ETF（588930）跌0.55%，報1.812元，成交額6442.32萬元。科創(chuàng)板人工智能ETF（588930）重倉股方面，金山辦公截止午盤漲…

01-29

從實驗室到車間家庭：機器人“進廠入家” 開啟智能生活新圖景

“在工業(yè)場景落地中，深度替代會經歷一個漸進過程，先從輔助性任務如搬運、分揀開始，積累數(shù)據(jù)和用戶信任；然后過渡到半自動化精密操作，如元件插接；最終實現(xiàn)全流程替代，這需要克服技術集成、成本優(yōu)化和人員培訓等挑戰(zhàn)。…

01-29

扎克伯格官宣：Meta AI進入大規(guī)模交付期，2026年押注超級智能布局

01-29

谷歌Google AI Plus服務擴至35地：高性價比AI體驗，原2TB會員可免費升級

01-29

扎克伯格勾勒2026AI藍圖：智能體電商領銜，多款AI新品蓄勢待發(fā)

01-29

特斯拉“逆流”投資xAI：無視股東投票爭議，加速AI與物理世界融合布局

01-29

特斯拉停產Model S/X轉型AI賽道弗里蒙特工廠將年產百萬臺人形機器人

01-29

OpenAI秘密研發(fā)“真人專屬”社交平臺，生物識別技術能否重塑社交新生態(tài)？

01-29

點擊查看更多 +

全站最新

從實驗室到車間家庭：機器人“進廠入家” 開啟智能生活新圖景

特斯拉2025年營收利潤雙降押注AI與機器人轉型股價逆勢上揚

阿里自研AI芯片"真武"亮相 "通云哥"黃金三角浮出水面

港股異動丨AI應用概念集體走強，邁富時漲超6%

奔馳迎140周年誕辰奧迪理想吉利等車企花式送祝福共賀盛事

港股異動丨內房股集體飆升！融創(chuàng)中國漲超30%，世茂集團漲超25%，碧桂園漲超23%

熱門內容

本欄最新

從實驗室到車間家庭：機器人“進廠入家” 開啟智能生活新圖景

特斯拉2025年營收利潤雙降押注AI與機器人轉型股價逆勢上揚

特斯拉停產Model S與X車型，聚焦自動駕駛，弗里蒙特工廠轉產Optimus機器人

特斯拉2025年營收利潤雙降轉型AI與機器人領域股價逆勢上揚

汽車工業(yè)140載輝煌路，中外車企共賀奔馳誕辰，奔馳暖心回應

本網(wǎng)站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

快手全新「檢索數(shù)據(jù)引擎」CroPS 入選AAAI 2026 Oral