滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

JPMorgan研究新發現：優化提問方式，解鎖AI回答高可靠性的密碼

時間：2026-02-28 23:49:28 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

人工智能助手在回答用戶問題時偶爾會出現看似合理卻錯誤的內容，這種現象被形象地稱為"幻覺"。J.P.Morgan人工智能研究院的最新研究從全新視角切入，發現通過優化提問方式可以顯著降低這類錯誤的發生概率。該研究團隊在arXiv平臺發布的論文顯示，問題本身的表達方式對AI回答的可靠性具有決定性影響。

研究團隊對近37萬個真實用戶提問展開分析，覆蓋13個主流問答數據集。通過構建包含17個維度的語言特征分析體系，研究人員發現問題的結構特征、詞匯選擇和邏輯表達方式都會直接影響AI的回答質量。這顛覆了傳統認知——過去普遍認為AI幻覺主要源于模型缺陷或解碼策略問題。

在風險特征識別方面，研究繪制出詳細的"問題風險圖譜"。模糊性表達被證實為首要風險因素，例如詢問"特斯拉相關信息"時，AI可能混淆公司、產品或發明家等不同概念。復雜句式同樣構成挑戰，包含多層條件從句的問題會使AI難以鎖定核心詢問點。否定句式則因增加邏輯推理難度，導致AI更容易出現偏差。

有趣的是，某些人類認為困難的語言特征對AI影響較小。研究顯示，罕見專業術語、最高級表達等特征，AI反而能夠較好處理。這表明人機認知機制存在本質差異，優化交互方式需要針對AI特性進行專門設計。

降低錯誤概率的有效策略包括：在問題中添加具體約束條件，如明確時間范圍、實體屬性等；使用"總結""比較"等明確指令動詞；提前澄清可能產生歧義的詞匯。實驗表明，經過優化的問題表述可使AI幻覺發生率降低40%以上。這種改進無需調整模型架構，僅通過改變提問方式即可實現。

不同任務類型呈現差異化風險模式。提取類任務因有明確參考依據，風險最低；選擇類任務受干擾項影響，風險居中；需要創造性回答的抽象類任務風險最高，其中44.5%的問題被標記為高風險。值得注意的是，問題長度的影響具有任務依賴性——在抽象任務中，問題越長風險越高；而在提取任務中，長度影響可忽略不計。

語言特征之間存在復雜的相互作用網絡。研究將17個特征劃分為三大群組：語法復雜度群組（包含句子長度、從句數量等）、語義明確性群組（包含意圖清晰度、可回答性等）和模糊性群組（包含多義詞、語境缺失等）。其中語法復雜度與風險呈負相關，適度的結構復雜反而能提供更多上下文線索。

風險預測模型展現出強大的泛化能力。通過交叉驗證發現，核心風險特征在不同數據集和應用領域均保持穩定關聯。這種穩定性為開發通用型問題優化工具奠定了基礎，相關模型已能實現70%左右的風險預測準確率。

領域特異性研究帶來意外發現。在AI訓練數據充足的領域（如計算機科學），專業問題的風險反而低于日常問題；而在訓練數據稀缺的領域，專業術語確實會增加回答不確定性。這提示用戶需要評估AI對特定領域的熟悉程度，合理調整預期。

基于這些發現，研究團隊提出三項實用建議：提問時添加具體限定詞，使用明確的指令動詞，主動消除潛在歧義。這些策略不僅適用于通用AI助手，也可為專業領域的人機交互提供指導。隨著AI技術普及，掌握"提問藝術"正在成為重要的數字素養，簡單的表達優化就能顯著提升人機協作效率。

更多>同類資訊

利亞德：切入機器人新賽道，提價策略助力盈利與Micro LED業務增長

02-28

寶馬德國工廠引入人形機器人：降本增效，改善員工工作環境有新招

02-28

OpenAI將引入英偉達新芯片英偉達借Groq技術拓展AI推理芯片市場

02-28

DeepSeek再陷崩潰風波，算力告急用戶吐槽，V4模型能否力挽狂瀾？

02-28

人形機器人與具身智能標準體系發布產業規范化發展邁入新征程

02-28

存儲芯片價格持續攀升：DRAM短期或觸頂 NAND下半年仍供不應求

02-28

AI浪潮下的裁員風暴：Block大裁4000人，員工未來路在何方？

02-28

德國嚴苛考驗國產機器人！王興興正裝迎戰，硬科技實力征服全場

到了機器人真機面前，他更是沒有半點含糊，當場伸手就去推機器人的手臂。這一次，王興興的機器人靠平衡算法、續航能力和實際應用場景，硬生生站住了場子。從被試探、被考驗，到讓對方認真記錄參數，這一幕不只是一場商務會…

02-28

天津具身智能創新中心公司成立鈦虎機器人等攜手注資六千萬布局智能領域

松果財經訊，天眼查App顯示，近日，天津具身智能創新中心有限公司成立，法定代表人為周磊，注冊資本6000萬人民幣，經營范圍含智能機器人的研發、智能機器人銷售、服務消費機器人銷售、工業機器人銷售、工業機器人制造…

02-28

成都發布全球首個全尺寸重載雙輪足機器人開源平臺開啟創新生態新篇章

本次發布的開源平臺，包含了從整機設計、核心控制系統到關鍵算法的全套技術資料，全球所有開發者、高校實驗室或科創團隊，都可以通過該平臺免費獲取這款RW-02OP雙輪足機器人的全部核心技術資產。其中包括：孵化產業生…

02-28

人形機器人“入職”鴻小飯堂跨維智能攜手維小飯開啟餐飲服務新體驗

近日，具身智能領軍企業跨維智能與數字化健康餐飲的標桿品牌維小飯（隸屬于深圳市維士數字飲食科技有限公司）強強聯合，宣布跨維智能的核心產品——DexForce W1 Pro 人形機器人，即將進駐維小飯與香港本土…

02-28

控制柜R-30IB軟件升級：提升響應速度，兼容新功能，增強穩定性

工業機器人核心控制單元是控制柜R - 30IB，隨著使用年限不斷增加，系統響應速度漸漸變得緩慢，新功能無法實現兼容等一系列問題逐步顯現出來。R- 30IB最新軟件開放了更多通訊接口，能夠支持與主流視覺品…

02-28

英偉達計劃推新處理器聚焦AI推理計算助力OpenAI提升系統效率

據《華爾街日報》援引知情人士消息，全球芯片巨頭英偉達正計劃推出一款新型處理器，旨在助力OpenAI等客戶構建速度更快、效率更高的AI系統。知情人士進一步披露，為加速推理計算能力，ChatGPT開發商Ope…

02-28

DeepSeek攜手清北突破I/O瓶頸！DualPath架構劇透V4，引領大模型推理新方向

而DeepSeek這次和清北合作提出的 DualPath雙路徑架構，本質就是修了兩條各具功能的專用傳輸通道，解決堵塞問題。近半年來，DeepSeek已與北大、清華聯手推出了多項重磅成果：比如ACL 202…

02-28

OpenAI將引入英偉達新芯片英偉達借Groq技術優化AI推理算力布局

IT之家 2 月 28 日消息，《華爾街日報》當地時間 27 日報道稱，OpenAI 將為其 AI 算力資源庫中增添一款利器：英偉達基于Groq 技術的推理工作負載優化芯片。這家剛完成新一輪融資的人工智能實…

02-28

點擊查看更多 +

全站最新

國家標準《廢舊電器電子產品處理要求第3部分：服務器》發布 "小巨人"凌雄科技參與起草

紅旗硬派SUV 1927最新諜照來襲！準量產版亮相，或4月北京車展上市

小米YU7 GT無偽裝路試諜照現身，黑化車身配紅點綴，極速300km/h引期待

尚界Z7冬測首秀無偽裝實車，途靈平臺助力極寒環境穩定操控

小米汽車預告圖引猜測或為Vision GT概念超跑 3月2日MWC將揭曉

華為途靈平臺加持，上汽尚界Z7冬測驚艷亮相，高端轎跑市場迎新勢力

熱門內容

本欄最新

中國科研新突破：新型電解液助力電動車續航破千公里且無懼極寒

愛奇藝多線布局背后：短期盈利難掩長期擴張隱憂與挑戰

春節下沉市場新茶飲大爆發：點位之爭、AI賦能與社交場景新變局

2026款長安UNI-Z PHEV上市，配置升級，限時優惠后9.89萬元起售

廣東加速“AI+制造”布局：華為億緯鋰能等企業科技革新引領產業升級

華為賦能廣汽新作！啟境獵裝轎跑6月上市，顏值科技雙在線成購車新選擇

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

JPMorgan研究新發現：優化提問方式，解鎖AI回答高可靠性的密碼