滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

OpenAI秘密研發新語音模型BiDi：可被打斷對話，客服場景或成突破口

時間：2026-03-06 19:00:43 來源：互聯網編輯：快訊 IP：北京 發表評論無障礙通道

據科技行業內部消息，OpenAI正秘密推進一項名為“BiDi”（取自“Bidirectional”縮寫）的音頻模型研發項目。該模型旨在突破現有語音交互的機械感，使人工智能與用戶的對話更接近人類自然交流模式。核心突破點在于實現雙向實時響應——當用戶中途插話或提出新觀點時，系統能夠動態調整回應內容，而非像傳統模型那樣被動等待完整語句輸入或中斷對話。

當前ChatGPT的語音功能采用輪次式交互設計：用戶需完整表達意圖后，系統才會解析內容并生成回復。這種模式在面對自然對話中的即時反饋時顯得笨拙——例如用戶用“明白”“確實”等短語回應時，模型常誤判為對話結束而停止輸出。更復雜的情況是，當用戶試圖在AI陳述過程中修正信息或轉換話題時，系統往往無法無縫銜接，導致交流體驗割裂。

BiDi模型的技術路徑與此截然不同。研發團隊通過持續分析音頻流中的聲學特征，構建了動態響應機制。當檢測到用戶語音中的停頓、語調變化或關鍵詞插入時，系統會立即激活上下文重評估模塊，在保持語義連貫性的前提下調整回應策略。這種設計使對話不再遵循固定的“輸入-處理-輸出”鏈條，而是形成類似人類交談的反饋循環。

盡管技術前景令人期待，但項目推進面臨顯著挑戰。測試數據顯示，BiDi原型在持續對話超過5分鐘后，會出現語義漂移或語音合成異常等問題。部分場景下，系統甚至會生成與上下文無關的回應片段。原計劃于2024年初發布的版本因此推遲，研發團隊正集中優化長對話穩定性與異常處理機制，最新時間表指向第二季度末。

OpenAI將語音交互視為擴大AI應用場景的關鍵入口。研究顯示，全球超過70%的用戶更傾向通過語音完成簡單指令，這一比例在移動場景下高達85%。BiDi模型若能實現預期效果，將顯著提升客服、教育、智能家居等領域的交互效率。特別是在多任務處理場景中，用戶可在對話中途隨時切換需求，系統需同步理解并調整服務流程，這對傳統語音系統構成技術跨越。

該模型在工具調用能力上的突破同樣值得關注。測試表明，BiDi可更精準地識別用戶語音中的隱含指令，例如在討論天氣時自然銜接至日程安排查詢，或在購物對話中無縫調用支付系統。這種跨應用協調能力，為未來語音交互設備的生態建設提供了技術基礎。

OpenAI的硬件戰略與語音模型研發形成協同效應。此前曝光的語音交互設備原型顯示，公司正探索將BiDi技術集成至便攜式終端，用戶可通過自然對話完成郵件撰寫、餐廳預訂等復雜操作。實時響應與中斷容忍能力被視為這類設備的核心競爭力，其技術成熟度將直接影響AI從“工具”向“助手”的角色轉型速度。

03-06

浪潮旗下YuanLab.ai開源發布Yuan3.0 Ultra大模型，為企業級AI應用注入新動能

其中，語言主干網絡基于混合專家（MoE）架構構建，包含 103 層 Transformer，訓練初始階段參數規模 1515B，通過 LAEP方法創新，團隊在預訓練過程中將模型參數優化至 1010B，預訓練算…

03-06

OpenAI發布開源評測CoT-Control，用于衡量模型思維鏈可控性

03-06

消息稱OpenAI研發新語音模型BiDi

03-06

螞蟻數科AItoB加速出海，螞蟻數科在馬來西亞設立運營中心

03-06

奈飛收購本·阿弗萊克創辦的影視AI技術公司

03-06

Rambus發布HBM4E內存控制器IP，為下一代AI處理器提供超強性能助力

這一新解決方案通過先進的可靠性功能實現了突破性性能，使設計師能夠應對下一代AI加速器和圖形處理器（GPU）對內存帶寬要求極高的需求。“作為AI應用領域的領先硅片IP供應商，我們正在將行業領先的HBM4E控制器…

03-06

構建“熱帶雨林”生態：高校賦能人工智能+創新發展新路徑

高校是創新供給的重要源頭，是提升國家創新體系整體效能的重要節點，是催生發展新質生產力的重要推力。打造“學科兩頭發力”“機制雙管齊下”的陣列式教育科技人才一體化動力引擎，營造 “陽光雨露充沛”“空間充足”的熱…

03-06

GPT-5.4原生操控電腦能力突破：OpenClaw迎來最強“大腦”賦能

Agent 能力是 2026 年 AI 進化的主線任務，在實測后，一個深刻的感受：GPT-5.4 可能是 2026 年目前為止，最適合跑OpenClaw 的模型。這意味著接入 GPT-5.4 的 Open…

03-06

國家發改委定目標：“十五五”末人工智能產業規模邁向超10萬億新臺階

IT之家 3 月 6 日消息，據新華社報道，國家發展改革委主任鄭柵潔 3 月 6 日在十四屆全國人大四次會議經濟主題記者會上說，將深化“人工智能+”行動，“十五五”末人工智能相關產業規模將增長到 10 萬億…

03-06

中國移動MWC展實力：5G-A領航、6G突破，共繪全球數智新藍圖

在2026世界移動通信大會（MWC）上，中國移動以“碳硅共生，合創AI+時代”為主題，系統展示了5G-A、6G、AI大模型及全球算力網絡的最新成果，凸顯中國通信技術在全球數字化轉型中的核心引領作用。應用層面，…

03-06

MWC 2026：中國移動“碳硅共生”引領，共繪AI+時代數智新畫卷

本次大會上，中國移動以“碳硅共生，合創AI+時代”為主題，全方位展示了其在通信、算力、智能服務三大領域的最新突破與全球布局。從5G-A的規模商用到6G的前沿探索，從全球算力網絡的堅實底座到“靈犀”智能體的全域…

03-06

MWC26巴塞羅那：華為八度折桂GLOMO獎彰顯創新實力

（全球TMT2026年3月6日訊）在MWC26巴塞羅那期間，華為斬獲八項重量級GLOMO獎項。華為在全頻段向5G演進過程中，圍繞超寬帶、多天線和綠色節能等領域開展了解決方案的創新，獲“最佳移動網絡基礎設施獎…

03-06

MWC 2026現場直擊：中國移動以創新科技，繪就數智生活新藍圖

縱觀此次中國移動在MWC2026的生動展示，這不僅是一場技術與創新的集中呈現，更是一次對未來場景的深度詮釋——它描繪了一幅以領先通信、泛在算力、強大AI為基石，科技與產業深度融合，智慧服務觸手可及的數智生活…

03-06

中國移動閃耀MWC 2026：以“中國方案”引領全球數智化“中式生活”新潮流

中國移動以“碳硅共生，合創AI+時代”為主題，攜通信服務、算力服務、智能服務三大主業的創新成果與產業解決方案亮相，生動展示了“中國智造”的科技實力與創新實踐的“中國標準”，以全新AI場景下的“中式生活”，彰…

03-06

點擊查看更多 +

全站最新

路虎攬勝星脈EV版諜照曝光設計獨特動力成謎首發時間存不確定性

吉利銀河戰艦北歐冬測，新能源硬派SUV市場或迎新競爭格局

比亞迪大唐首發亮相：空間配置性能亮眼閃充加持能否成市場新寵？

東風全新VAN車諜照曝光！設計革新+公告申報，品牌煥新后即將登場

奧鈴極電福建區域上市精準適配全場景助力東南沿海物流提質增效

別克至境E7大五座SUV內飾曝光：云感座椅、影院屏等打造豪華舒適新體驗

熱門內容

本欄最新

宋Ultra EV預售開啟：二代刀片電池加持，15.5萬起重塑B級純電SUV格局

零代碼也能輕松建站？AI工具讓網站搭建從技術活變簡單操作

黃仁勛“最后一投”背后：AI投資邏輯生變，行業邁向務實新階段

MWC2026現場：中興發布全球首款AI+Wi-Fi 8 CPE，移動互聯終端戰略再升級

廣汽豐田鉑智7來襲！3月5日預售，鴻蒙座艙5助力合資純電智能化突圍

魯大師2月電動兩輪車榜單揭曉：九號小牛領跑，智能化成競爭新焦點

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

OpenAI秘密研發新語音模型BiDi：可被打斷對話，客服場景或成突破口