滾動資訊

當前位置：首頁 > 資訊 > 業界動態 > 正文內容

谷歌升級Gemini API：新增Flex與Priority推理層級

時間：2026-04-03 23:54:50 來源：鞭牛士編輯：快訊 IP：北京 發表評論無障礙通道

AIPress.com.cn報道

4月3日消息，谷歌宣布為Gemini API新增兩種服務層級，Flex Inference與Priority Inference，以幫助開發者在成本與系統可靠性之間進行更精細的權衡。新機制通過統一接口實現，使開發者能夠根據不同任務需求動態調整推理優先級。

隨著AI應用從簡單對話擴展到更復雜的Agent系統，開發者通常需要同時處理兩類任務：一類是無需即時響應的大規模后臺任務，例如數據處理或模型“思考”過程；另一類則是面向用戶的實時交互任務，如聊天機器人或Copilot工具。這兩類任務在延遲和穩定性上的需求差異較大。

此前，開發者往往需要在同步API與異步Batch API之間拆分架構以滿足不同需求。谷歌表示，新推出的Flex與Priority層級旨在簡化這一流程，使開發者能夠通過同一套同步接口處理不同類型的工作負載。

Flex Inference是一種面向成本優化的推理模式，適用于對延遲不敏感的任務場景。開發者在將請求設置為Flex層級后，可以以標準API約一半的價格運行模型，但相應地需要接受更高延遲以及較低的服務可靠性。谷歌表示，該模式適用于客戶關系管理數據更新、大規模研究模擬以及需要模型在后臺進行復雜推理的Agent工作流。

與之相對，Priority Inference則是面向關鍵業務場景的高可靠性推理服務。該模式在平臺負載較高時仍能優先處理請求，從而提高系統穩定性。若用戶的Priority流量超過配額，超出的請求會自動降級至標準服務層級，而不會直接失敗，以確保應用持續運行。

谷歌表示，Priority模式適用于實時客服系統、在線內容審核以及對響應速度和穩定性要求較高的應用場景。API返回結果還會標明實際使用的服務層級，使開發者能夠更清晰地了解性能表現與計費情況。

兩種新服務層級均可通過設置請求參數中的service_tier字段進行調用，并適用于Gemini API中的GenerateContent與Interactions接口。谷歌稱，這一機制旨在為開發者提供更靈活的成本與性能控制，以支持AI應用在生產環境中的規模化部署。（AI普瑞斯編譯）

更多>同類資訊

Meta將在硅谷裁員近200人

04-03

東方甄選正籌備自營保健品業務，擬推出多款「藍帽子」新品

04-03

《桃花簪》出品方被罰暫停上傳15天！紅果下架涉事劇

04-03

抖音集團短劇版權中心設2億專項資金，激勵真人短劇題材創新

04-03

SpaceX計劃在IPO中尋求超過2萬億美元估值

04-03

為請楊笠道歉？羅永浩：不怕退休，可全職罵傻x

04-03

京東團購正式上線，首批門店已開啟試運營

04-03

受零部件漲價影響小米及REDMI部分在售產品4月11日起調整建議零售價

04-03

小米車主維權進展：超2萬參與者助力，首例民事訴訟勝訴獲賠道歉

04-03

雷軍朋友圈官宣：MiMo大模型調用量突破1萬億Token 小米迎新里程碑

04-03

谷歌Gemini API再升級：Flex與Priority層級助力開發者靈活平衡成本與性能

04-03

Meta硅谷再裁近200人：一邊裁員瘦身一邊加碼AI賽道布局

04-03

谷歌推進太空數據中心計劃，能源新解與挑戰并存引關注

04-03

抖音集團短劇版權中心豪擲2億，為真人短劇題材創新注入強勁動力

04-03

羅永浩力挺楊笠引爭議霸氣回應：退休可全職罵傻x不在乎脫粉

04-03

點擊查看更多 +

全站最新

邁從北京旗艦店開業：線下空間搭建，完善用戶認知體驗轉化全鏈路

TOP TOY更新招股書：營收凈利雙增，門店會員擴張自有IP成果顯著

2027年起實施！移動電源新國標發布，多項要求強化產品安全保障

美國3月非農數據遠超預期創逾一年高位

美國3月失業率小幅回落至4.3%

美媒：知情人士透露，伊朗擊落了一架美國戰斗機

熱門內容

本欄最新

雷軍直播拆解新一代SU7：鎖單量破4萬，交付提速，“百色計劃”引期待

紐北賽道現身紅色猛獸！小米YU7 GT實車曝光，千匹馬力劍指最速SUV

車企營銷新玩法：從流量接梗到人格破圈，2026車圈花式出圈大賞

意念操控未來新篇平安銀行“企望中國行”與企業家共探強腦科技奧秘

中美Robotaxi“停車”事件引關注：是故障還是安全策略的探索？

中美無人車“停車”事件引熱議：是謹慎之舉，還是技術之困？

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR比爾科技官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 聯系入口
Copyright ? 比爾科技 2007-2024 ITBEAR.COM.CN All rights reserved.

岛国av一区二区_不卡av片_超碰997_精品国产一区二区在线_av中文天堂在线_韩国舌吻呻吟激吻原声

谷歌升級Gemini API：新增Flex與Priority推理層級