谷歌为Gemini API新增Flex和Priority两大服务层级,旨在统一接口下提供更精细的成本与可靠性控制。随着AI从简单对话演进为复杂自主代理,开发者需兼顾高吞吐、低延迟要求不严的后台任务(如数据增强、推理计算),以及高可靠、低延迟的交互任务(如聊天机器人、协作者)。此前需分别依赖同步API与异步Batch API,架构复杂。新层级允许全部通过标准同步端点路由:Flex处理后台任务,兼顾成本效益;Priority保障交互任务的稳定响应。此举简化架构,消除异步管理负担,同时实现性能与经济性双重优化。(200字)

本专栏通过快照技术转载,仅保留核心内容

内容中包含的图片若涉及版权问题,请及时与我们联系删除