滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

西伯利亞神經(jīng)網(wǎng)絡(luò)公司創(chuàng)新：RM-RF模型重塑軟件單元測試評估新格局

時間：2026-02-04 03:49:35 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在自動化軟件測試領(lǐng)域，一項突破性研究為開發(fā)者帶來了效率革命。由西伯利亞神經(jīng)網(wǎng)絡(luò)公司牽頭，聯(lián)合T技術(shù)公司與新西伯利亞國立大學的研究團隊，開發(fā)出名為RM-RF的智能評估模型，其核心創(chuàng)新在于顛覆了傳統(tǒng)"運行才能驗證"的測試評估模式。該模型通過直接分析代碼文本，即可預測測試用例的質(zhì)量指標，這項成果已發(fā)表于arXiv預印本平臺（編號arXiv:2601.13097v1）。

傳統(tǒng)測試評估流程猶如進行全面體檢，需要經(jīng)歷編譯代碼、運行測試、計算覆蓋率等復雜步驟。在大型項目中，完整評估周期可能長達數(shù)日，且消耗大量計算資源。研究團隊將RM-RF模型比作資深醫(yī)療專家，僅通過"病歷審查"就能判斷健康狀況——該模型通過解析源代碼、現(xiàn)有測試用例和新增測試代碼，即可預測測試能否正常運行、覆蓋率提升幅度及突變檢測有效性三大核心指標。

模型訓練過程堪稱構(gòu)建"數(shù)字食譜庫"。研究團隊收集了22,285個多語言樣本，涵蓋Java、Python和Go三種主流編程語言。這個數(shù)據(jù)集不僅包含人工編寫的測試代碼，還特意混入AI生成和錯誤示例，確保模型能識別各類測試場景。通過對比零樣本學習、完整參數(shù)微調(diào)及參數(shù)高效微調(diào)三種訓練策略，研究人員發(fā)現(xiàn)70億參數(shù)模型經(jīng)完整微調(diào)后效果最佳，在三個評估維度上取得0.69的平均F1分數(shù)。

嚴格的評估體系確保了模型可靠性。研究團隊采用項目級數(shù)據(jù)隔離策略，訓練集與驗證集完全來自不同開源項目。更特別構(gòu)建了包含最新AI生成測試代碼的測試集，這些代碼均在模型訓練完成后產(chǎn)生，有效避免數(shù)據(jù)泄露風險。實驗數(shù)據(jù)顯示，RM-RF在Java語言的突變檢測中表現(xiàn)尤為突出，F(xiàn)1分數(shù)達0.71，而代碼覆蓋率預測在各語言間保持均衡表現(xiàn)。

效率對比凸顯技術(shù)優(yōu)勢。傳統(tǒng)方法處理相同測試量需數(shù)日，而RM-RF僅需數(shù)小時即可完成，速度提升達數(shù)十倍。這種效率躍升類似于從傳統(tǒng)烤箱到微波爐的變革，不僅縮短等待時間，更顯著降低能耗。在錯誤識別方面，模型對構(gòu)造函數(shù)錯誤、未定義實體等常見問題判斷精準，但對依賴缺失等復雜問題的識別仍需改進。

實際應(yīng)用場景展現(xiàn)三大價值。首先在大規(guī)模測試生成中，開發(fā)者可先生成海量候選測試，再通過模型快速篩選優(yōu)質(zhì)用例；其次在強化學習訓練中，模型能提供實時質(zhì)量反饋，加速學習進程；最后在持續(xù)集成環(huán)節(jié)，可作為預檢查工具減少無效測試運行。研究團隊特別強調(diào)，中等規(guī)模模型（70億參數(shù)）在完整微調(diào)下表現(xiàn)最優(yōu)，說明任務(wù)適配性比單純追求模型規(guī)模更重要。

技術(shù)細節(jié)揭示創(chuàng)新本質(zhì)。模型通過分析原始代碼（主食材）、現(xiàn)有測試（調(diào)味料）和新增測試（新調(diào)料）的組合關(guān)系，預測整體測試效果。這種文本分析方式突破了傳統(tǒng)執(zhí)行依賴，為性能預測、內(nèi)存分析等場景開辟新路徑。研究團隊在數(shù)據(jù)收集階段即注重質(zhì)量把控，從GitHub精選活躍項目，確保代碼時效性和多樣性，同時避免與訓練數(shù)據(jù)重疊。

當前研究已展現(xiàn)實用潛力。在真實項目測試中，RM-RF的預測準確性與傳統(tǒng)方法持平，但效率實現(xiàn)數(shù)量級提升。這種"不運行即評估"的模式，為軟件開發(fā)引入智能預判機制，猶如為程序員配備實時輔導系統(tǒng)，在編寫測試時即可獲得優(yōu)化建議，無需等待漫長編譯過程。研究團隊正探索將模型集成到強化學習流程，實現(xiàn)端到端驗證，并計劃擴展更多編程語言支持。

更多>同類資訊

香港灣仔海濱2026架無人機閃耀夜空共繪馬年新春美好愿景

2月14日，人們在香港灣仔海濱觀看、拍攝無人機表演。一場由2026架無人機呈現(xiàn)的大型無人機表演，14日晚在香港灣仔海濱舉行，為即將到來的馬年新春增添喜慶祥和的節(jié)日氣氛。表演開始，巨型金色“馬”字在維港…

02-16

本土工業(yè)控制器崛起：從15%到30%的國產(chǎn)化突圍之路

02-16

賓利歐陸SC：可拆卸車頂詮釋奢華，低里程珍品即將拍賣引關(guān)注

02-16

DeepSeek更新引熱議：性格“變冷”上熱搜，V4編程實力或顛覆格局

如今，全網(wǎng)都在蹲DeepSeek V4了。這幾天，很多人都發(fā)現(xiàn)突然間，DeepSeek的性格變了。比起DeepSeek變冷淡，全網(wǎng)更在乎的是，V4到底哪天出世？這意味著模型在整個訓練流程中對數(shù)據(jù)模式的理解…

02-16

肇慶高要無人機“出征”春運，空地聯(lián)動織密道路安全“防護網(wǎng)”

為應(yīng)對春運期間激增的交通壓力，肇慶市高要區(qū)“百縣千鎮(zhèn)萬村高質(zhì)量發(fā)展工程”指揮部信息化建設(shè)專班將無人機巡檢系統(tǒng)深度嵌入交通保障全流程，以“空中調(diào)度+地面聯(lián)動”模式，為轄區(qū)道路疏堵保暢插上科技翅膀。專班表示，返程…

02-16

火星最年輕火山：單次噴發(fā)表象下，隱藏著怎樣復雜的巖漿活動？

02-16

熱門PC游戲光追支持率低：21款大作僅5款支持，光追應(yīng)用尚待普及

02-15

國聯(lián)民生上訴龍力案二審啟動歷史風險處置成持續(xù)發(fā)展關(guān)鍵議題

02-15

新宙邦：電解液回暖利潤遜色，固態(tài)電池布局下港股IPO擴產(chǎn)路幾何？

02-15

國鐵廣州局筑牢粵湘電煤運輸保障線

02-15

歐洲央行行長拉加德反對通過征稅阻止資本外流

02-15

機構(gòu)：三線以下城市游客預訂景區(qū)門票增三成

02-15

京和文旅2025：堅守耕耘共成長，攜手啟航新征程

02-15

分析師：特朗普政府中期選舉的成敗可能取決于選民是否切實感受到日常生活有所改善

02-15

陶冬：2026年AI行業(yè)將進入洗牌階段，財務(wù)脆弱的公司可能因融資困境引發(fā)連鎖反應(yīng)

02-15

點擊查看更多 +

全站最新

品牌破局新路徑：AI驅(qū)動系統(tǒng)化賦能，真實案例揭秘全域霸屏方法論

小米YU7 GT工信部申報亮相，性能顏值雙在線，高端純電市場新選擇來襲

油車與電車高負荷耐久性大不同：技術(shù)差異下的性能表現(xiàn)解析

重載行駛能耗大比拼：油車穩(wěn)定VS電車激增，誰更勝一籌？

燃油車與電動車高速性能大比拼：動力能耗續(xù)航誰更勝一籌？

2026春節(jié)租車熱潮涌動：00后成主力，新能源車型預訂量飆升6倍

熱門內(nèi)容

本欄最新

賓利歐陸SC：可拆卸車頂詮釋奢華，低里程珍品即將拍賣引關(guān)注

歸鄉(xiāng)記 | 每年一次的人口大遷徙

千問第二波免單恰逢情人節(jié)，縣城鐘點房幫訂量暴增約300%

國家網(wǎng)信辦公布境內(nèi)第四批7家金融信息服務(wù)機構(gòu)

北京無限宇航自研100N雙組元液體火箭發(fā)動機高模試車成功性能達國際領(lǐng)先

心愛新能源2026戰(zhàn)略發(fā)布：以產(chǎn)品創(chuàng)新為翼，向行業(yè)第一梯隊振翅高飛

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

西伯利亞神經(jīng)網(wǎng)絡(luò)公司創(chuàng)新：RM-RF模型重塑軟件單元測試評估新格局