清華大學(xué)智能產(chǎn)業(yè)研究院近日公布了一項(xiàng)針對(duì)自動(dòng)駕駛領(lǐng)域的重要研究成果。該研究以安全關(guān)鍵場(chǎng)景為切入點(diǎn),創(chuàng)新性地采用“眼動(dòng)追蹤實(shí)驗(yàn)+算法驗(yàn)證”的雙重研究范式,首次系統(tǒng)解析了人類駕駛員與智能駕駛算法在視覺(jué)注意力分配機(jī)制上的根本性差異。研究團(tuán)隊(duì)構(gòu)建了包含三個(gè)層級(jí)的注意力量化模型,為理解人類駕駛行為提供了新的理論框架。
實(shí)驗(yàn)設(shè)計(jì)突破傳統(tǒng)研究范式,招募專業(yè)駕駛員與普通駕駛者完成三類典型任務(wù):道路風(fēng)險(xiǎn)識(shí)別、功能可用性判斷及異常事件檢測(cè)。通過(guò)高精度眼動(dòng)儀記錄120名受試者的視覺(jué)軌跡,結(jié)合深度學(xué)習(xí)算法對(duì)20萬(wàn)幀注視數(shù)據(jù)進(jìn)行聚類分析,成功劃分出“本能反應(yīng)-經(jīng)驗(yàn)判斷-認(rèn)知推理”的三階段注意力演化模型。這一發(fā)現(xiàn)顛覆了學(xué)界對(duì)駕駛注意力單純依賴空間定位的傳統(tǒng)認(rèn)知。
研究團(tuán)隊(duì)將人類注意力模型植入現(xiàn)有算法體系,在AxANet、UniAD等主流感知算法及DriveLM視覺(jué)語(yǔ)言模型中嵌入語(yǔ)義注意力模塊。對(duì)比實(shí)驗(yàn)顯示,改進(jìn)后的算法在復(fù)雜場(chǎng)景理解準(zhǔn)確率上提升27.3%,特別是在處理交通標(biāo)志遮擋、非標(biāo)準(zhǔn)交通行為等邊緣案例時(shí),性能提升幅度達(dá)41.6%。關(guān)鍵突破在于算法獲得了類似人類的語(yǔ)義優(yōu)先級(jí)判斷能力,能夠自主識(shí)別"前方學(xué)校區(qū)域"比"道路施工"具有更高安全權(quán)重。
這項(xiàng)成果為自動(dòng)駕駛技術(shù)發(fā)展開辟了新路徑。傳統(tǒng)方案依賴海量數(shù)據(jù)訓(xùn)練提升模型泛化能力,而本研究證明通過(guò)引入人類認(rèn)知機(jī)制中的語(yǔ)義理解模塊,可顯著降低算法對(duì)訓(xùn)練數(shù)據(jù)的依賴度。在車載計(jì)算資源受限的現(xiàn)實(shí)條件下,這種輕量化改進(jìn)方案使算法部署成本降低60%以上,特別適用于中低端車型的智能化升級(jí)。
實(shí)驗(yàn)數(shù)據(jù)進(jìn)一步顯示,專業(yè)駕駛員在認(rèn)知推理階段的注意力分配占比達(dá)58%,而當(dāng)前最先進(jìn)的算法在該階段的表現(xiàn)不足12%。這種差距在雨雪天氣、城鄉(xiāng)結(jié)合部等非結(jié)構(gòu)化場(chǎng)景中尤為明顯。研究負(fù)責(zé)人指出,未來(lái)工作將聚焦于構(gòu)建動(dòng)態(tài)語(yǔ)義權(quán)重庫(kù),使算法能夠根據(jù)實(shí)時(shí)路況自動(dòng)調(diào)整語(yǔ)義理解策略,這或?qū)⑼苿?dòng)自動(dòng)駕駛技術(shù)向真正類人化方向演進(jìn)。











