滾動資訊

當前位置：首頁 > 資訊 > 信息流 > 正文內(nèi)容

專為科研設(shè)計！AI模型“OpenScholar”引文準確率媲美人類專家

時間：2026-02-05 10:22:42 來源：互聯(lián)網(wǎng)編輯：快訊 IP：北京 發(fā)表評論無障礙通道

在科學研究的領(lǐng)域中，文獻綜述一直是支撐循證決策、優(yōu)化科研流程以及啟發(fā)新發(fā)現(xiàn)的關(guān)鍵環(huán)節(jié)。然而，隨著科學文獻數(shù)量的爆炸式增長，科研人員要全面掌握相關(guān)資訊變得愈發(fā)困難。盡管商用大語言模型在一定程度上能夠提供協(xié)助，但它們在處理科學文獻時往往存在歸因能力不足和引文幻覺等問題，給科研工作帶來諸多困擾。

為解決這一難題，美國華盛頓大學的研究團隊開發(fā)了一款名為“OpenScholar”的開源語言模型。該模型是專門為科研任務(wù)設(shè)計的檢索增強語言模型，通過將特定框架與包含4500萬篇最新開放獲取科研論文的專業(yè)數(shù)據(jù)庫相結(jié)合，并引入自我評估機制，顯著優(yōu)化了其輸出結(jié)果。這一創(chuàng)新設(shè)計使得“OpenScholar”在準確進行文獻綜述方面表現(xiàn)出色，甚至超越了部分商用大語言模型。

在實驗測試中，“OpenScholar”展現(xiàn)出了卓越的性能。與GPT4o相比，后者在78%至90%的情況下會出現(xiàn)引文幻覺，而“OpenScholar”的引文準確率則與人類專家相近。研究團隊還創(chuàng)建了名為“ScholarQABench”的基準工具來評估文獻綜述的自動化水平。測試結(jié)果顯示，“OpenScholar”的準確率比GPT4o和PaperQA2（另一款文獻綜述工具）分別高出6.1%和5.5%。更令人矚目的是，在50%到70%的情況下，“OpenScholar”生成的答案比專家注釋器的答案更具實用性。

“OpenScholar”的出現(xiàn)，為科研人員提供了一種更為可靠和高效的文獻綜述工具。它不再追求通用性，而是專注于科學文獻這一特定領(lǐng)域，力求提供準確、全面且透明的綜述結(jié)果。這一特點使得科研人員能夠更快速地篩選出有價值的信息，減少在繁瑣文獻中耗費的時間和精力。

盡管“OpenScholar”在文獻綜述方面取得了顯著進展，但研究團隊也指出，該系統(tǒng)仍存在一定的局限性。他們強調(diào)，基于語言模型的系統(tǒng)無法完全實現(xiàn)科學文獻綜述的自動化，仍需要科研人員的專業(yè)判斷和干預。為了推動該工具的進一步優(yōu)化和完善，研究團隊向?qū)W界開放了“ScholarQABench”和“OpenScholar”，鼓勵更多科研人員參與研究和改進工作。

對于科研人員而言，“OpenScholar”的出現(xiàn)無疑是一個福音。它如同一張專門為科學海洋設(shè)計的網(wǎng)，能夠幫助他們更精準地捕捉到真正有價值的信息，避免被虛假或錯誤的引文所誤導。這一創(chuàng)新工具有望將科研人員從繁瑣、易錯的文獻綜述工作中部分解放出來，讓他們能夠?qū)⒏嗟木ν度氲秸嬲乃伎己桶l(fā)現(xiàn)中。

更多>同類資訊

香港灣仔海濱2026架無人機閃耀夜空共繪馬年新春美好愿景

2月14日，人們在香港灣仔海濱觀看、拍攝無人機表演。一場由2026架無人機呈現(xiàn)的大型無人機表演，14日晚在香港灣仔海濱舉行，為即將到來的馬年新春增添喜慶祥和的節(jié)日氣氛。表演開始，巨型金色“馬”字在維港…

02-16

本土工業(yè)控制器崛起：從15%到30%的國產(chǎn)化突圍之路

02-16

賓利歐陸SC：可拆卸車頂詮釋奢華，低里程珍品即將拍賣引關(guān)注

02-16

DeepSeek更新引熱議：性格“變冷”上熱搜，V4編程實力或顛覆格局

如今，全網(wǎng)都在蹲DeepSeek V4了。這幾天，很多人都發(fā)現(xiàn)突然間，DeepSeek的性格變了。比起DeepSeek變冷淡，全網(wǎng)更在乎的是，V4到底哪天出世？這意味著模型在整個訓練流程中對數(shù)據(jù)模式的理解…

02-16

肇慶高要無人機“出征”春運，空地聯(lián)動織密道路安全“防護網(wǎng)”

為應(yīng)對春運期間激增的交通壓力，肇慶市高要區(qū)“百縣千鎮(zhèn)萬村高質(zhì)量發(fā)展工程”指揮部信息化建設(shè)專班將無人機巡檢系統(tǒng)深度嵌入交通保障全流程，以“空中調(diào)度+地面聯(lián)動”模式，為轄區(qū)道路疏堵保暢插上科技翅膀。專班表示，返程…

02-16

火星最年輕火山：單次噴發(fā)表象下，隱藏著怎樣復雜的巖漿活動？

02-16

熱門PC游戲光追支持率低：21款大作僅5款支持，光追應(yīng)用尚待普及

02-15

國聯(lián)民生上訴龍力案二審啟動歷史風險處置成持續(xù)發(fā)展關(guān)鍵議題

02-15

新宙邦：電解液回暖利潤遜色，固態(tài)電池布局下港股IPO擴產(chǎn)路幾何？

02-15

國鐵廣州局筑牢粵湘電煤運輸保障線

02-15

歐洲央行行長拉加德反對通過征稅阻止資本外流

02-15

機構(gòu)：三線以下城市游客預訂景區(qū)門票增三成

02-15

京和文旅2025：堅守耕耘共成長，攜手啟航新征程

02-15

分析師：特朗普政府中期選舉的成敗可能取決于選民是否切實感受到日常生活有所改善

02-15

陶冬：2026年AI行業(yè)將進入洗牌階段，財務(wù)脆弱的公司可能因融資困境引發(fā)連鎖反應(yīng)

02-15

點擊查看更多 +

全站最新

問界M8斬獲“風云2025智行汽車” 問界以智慧科技引領(lǐng)高端智能汽車新未來

馬自達未棄轉(zhuǎn)子發(fā)動機：雖不量產(chǎn)性能車，但仍有希望盼未來

總臺第六屆《汽車風云盛典》啟幕以“全維安全”引領(lǐng)汽車產(chǎn)業(yè)新征程

觸屏操作遇挑戰(zhàn)！新規(guī)推動駕駛核心功能回歸實體按鍵科技與安全并重

馬自達6e英國上市，售價超中國兩倍，這差價背后藏著啥秘密？

北汽極狐阿爾法S5煥新登場！增程版上線，續(xù)航焦慮不再有

熱門內(nèi)容

本欄最新

賓利歐陸SC：可拆卸車頂詮釋奢華，低里程珍品即將拍賣引關(guān)注

歸鄉(xiāng)記 | 每年一次的人口大遷徙

千問第二波免單恰逢情人節(jié)，縣城鐘點房幫訂量暴增約300%

國家網(wǎng)信辦公布境內(nèi)第四批7家金融信息服務(wù)機構(gòu)

北京無限宇航自研100N雙組元液體火箭發(fā)動機高模試車成功性能達國際領(lǐng)先

心愛新能源2026戰(zhàn)略發(fā)布：以產(chǎn)品創(chuàng)新為翼，向行業(yè)第一梯隊振翅高飛

本網(wǎng)站LOGO小熊標志受版權(quán)保護，版權(quán)登記號：魯作登字-2015-F-025467，未經(jīng)ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網(wǎng)站是公益性科普網(wǎng)站，為網(wǎng)友提供科技類資訊內(nèi)容，無障礙技術(shù)由太陽灣捐增，為閱讀障礙用戶提供內(nèi)容聽讀服務(wù)。如本站內(nèi)容侵犯了您的權(quán)利，請通知我們及時刪除。
中國（山東）自由貿(mào)易試驗區(qū) 魯ICP備11015305號-1 聯(lián)系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

專為科研設(shè)計！AI模型“OpenScholar”引文準確率媲美人類專家