OpenAI 推出 Flex 处理模式:开发者可用更低价格使用 o3 与 o4-mini
OpenAI推出了 Flex 处理模式,为使用其 o3 和 o4-mini 模型的开发者提供了一种更实惠的选择。
这一新功能允许用户将成本减半,前提是他们愿意接受更慢的处理速度以及有限的可用性。
Flex 目前处于测试阶段(beta),主要面向无需实时结果的任务,包括内部评估、数据补充和后台作业。
通过提供低成本选项,OpenAI 旨在支持那些对时效性要求不高的开发项目。
什么是 Flex 处理? OpenAI推出 Flex 处理 Flex 处理让用户能够以更低的价格访问 OpenAI 的模型,但代价是处理速度会变慢。
任务可能需要更长时间才能完成,并且当需求量较大时,有时访问会被延迟。
虽然这在大型软件项目中可能带来不便,但 Flex 处理非常适合一些较为简单的用途。
例如:后台任务、非生产环境的工作负载、科研与测试,以及异步处理等。
每周 AI 通讯 加入 10,000+ AI 爱好者,学习如何构建和部署专属 AI 智能体,让它们全天候为你自动化处理任务。
能省多少钱? Flex 能将价格削减 50%。具体定价结构如下:
模型 | 方案类型 | 输入费用(每百万 tokens) | 输出费用(每百万 tokens) |
o3 | 标准 | $10.00 | $40.00 |
o3 | Flex | $5.00 | $20.00 |
o4-mini | 标准 | $1.10 | $4.40 |
o4-mini | Flex | $0.55 | $2.20 |
Flex 推出的时机 Flex 的推出具有战略意义。AI 运行成本持续上升,像ASPCMS社区这样的竞争对手也在推出更低成本的模型,例如 Gemini2.5 Flash(以更低输入费用实现强劲性能)。
OpenAI 推出 Flex,正是对市场竞争的直接回应。它让开发者能够更灵活地控制开支,同时在日常或内部任务中不必牺牲模型质量。
展开全文需要注意的局限 虽然 Flex 能帮助降低成本,但它也有一些缺点:响应时间较慢、资源可用性受限,并且不适合生产系统。
因此,Flex 最适合用于低优先级的任务。开发者不应将其用于实时应用或面向用户的工具。
新的身份验证要求 OpenAI 还在加强对模型的访问管理。现在,处于第 1–3 层使用级别的开发者,须完成身份验证流程,才能使用 o3 及相关功能。
OpenAI 表示,此举是为了防止滥用并保护其平台。身份验证流程将根据用户的消费级别来实施。