岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

ITBear旗下自媒體矩陣:

快手全新「檢索數(shù)據(jù)引擎」CroPS 入選AAAI 2026 Oral

   時間:2026-01-16 08:58:25 來源:互聯(lián)網(wǎng)編輯:茹茹 IP:北京 發(fā)表評論無障礙通道
 

短視頻搜索業(yè)務是向量檢索在工業(yè)界最核心的應用場景之一。然而,當前業(yè)界普遍采用的“自強化”訓練范式過度依賴歷史點擊數(shù)據(jù),導致系統(tǒng)陷入信息繭房,難以召回潛在相關的新鮮內容。針對當前挑戰(zhàn),快手搜索團隊提出了CroPS框架,從根源上打破數(shù)據(jù)閉環(huán)。目前,CroPS已在快手搜索業(yè)務中實現(xiàn)全量部署,服務億級用戶。

本工作相關成果《CroPS: Improving Dense Retrieval with Cross-Perspective Positive Samples in Short-Video Search》已被人工智能頂級會議AAAI 2026 Oral接收。

為了打破數(shù)據(jù)邊界,CroPS 框架構建了一個包含三個維度的正樣本增強引擎,分別利用用戶換Query行為、推薦系統(tǒng)反饋以及大語言模型(LLM)的世界知識,來全方位地豐富語義空間。圍繞這一目標,CroPS 分別從查詢行為、系統(tǒng)反饋和外部知識三個層面展開。

在真實的搜索場景中,用戶往往難以一次性精準表達意圖。當用戶輸入查詢詞A 卻未能找到滿意結果時,通常會進行查詢重構,輸入語義相關但表述不同的查詢詞B。CroPS 通過分析用戶在短時間窗口內的改寫序列,將改寫后獲得的成功點擊回流給原始查詢,利用用戶的修正行為來糾正模型的語義偏差。

推薦系統(tǒng)擁有海量用戶消費數(shù)據(jù),其算法機制天然傾向于發(fā)散和探索。CroPS 建立了一套跨系統(tǒng)的信號橋接機制:對于同一個用戶,如果他在推薦信息流中深度消費了某個視頻,且該視頻在語義上與用戶近期的搜索詞高度相關,該視頻就會被引入作為搜索模型的正樣本。

當平臺現(xiàn)有的內容庫或日志無法覆蓋某些長尾、復雜查詢時,CroPS 引入大語言模型(LLM)作為虛擬檢索器和內容生成器,利用 One-shot Prompting 策略生成高質量合成樣本,將外部世界的常識與邏輯蒸餾進檢索模型中。

在多源正樣本被引入之后,如何讓模型有效利用這些信號,同樣成為訓練階段的關鍵。HLA 的核心是解決 CroPS 多源正樣本的可靠性差異問題,通過為樣本分配分層標簽,讓模型能夠學習更細粒度的相關性。H-InfoNCE 在訓練時,將當前樣本與標簽嚴格低于它的所有樣本進行對比,使學習目標與 HLA 的層級邏輯完全對齊。

這一系列設計共同構成了 CroPS 在工業(yè)檢索場景中的完整解決方案。CroPS 證明了在工業(yè)檢索系統(tǒng)中,正樣本增強是緩解信息繭房問題的有效鑰匙。未來,快手搜索團隊將進一步探索 CroPS 與生成式檢索(Generative Retrieval)方法的融合,持續(xù)挖掘大規(guī)模語言模型在搜索全鏈路中的潛力。

 
 
更多>同類資訊
全站最新
熱門內容
網(wǎng)站首頁  |  關于我們  |  聯(lián)系方式  |  版權聲明  |  爭議稿件處理  |  English Version
 
主站蜘蛛池模板: 久久久久久高清 | 黄页网站在线播放 | 中文字幕在线不卡 | 亚洲天堂午夜 | 337p粉嫩色噜噜噜大肥臀 | 亚洲午夜精品久久久久久浪潮 | 国产黄色片视频 | 中文字幕免费视频 | www国产视频 | 久久精品视频免费观看 | 黄色三级国产 | 欧洲亚洲一区二区 | 国产黄免费 | 久久精品香蕉 | 国产精品三 | av国产免费 | 在线观看免费成人 | 一级欧美视频 | 一卡二卡在线 | 日本韩国在线 | 日韩av女优在线观看 | 一级黄色片免费 | 色中色综合 | 免费看的毛片 | 国产又爽又黄免费视频 | 97国产在线 | 一区二区三区国产在线观看 | 在线观看视频中文字幕 | 涩色av| 黄色av成人 | 18国产免费视频 | 国产精品久久久久一区二区三区 | 日本h视频在线观看 | 日韩久久一区 | 久久一区二 | 成人www| 三级视频国产 | 大香蕉毛片 | 狠狠躁夜夜躁人人爽视频 | 日本一区二区三区在线观看视频 | 日韩爱爱 |