GPT-5.4 Nano
GPT-5.4 Nano 是 GPT-5.4 系列中体量最小、成本最低的版本,于 2026 年 3 月 17 日发布,面向对速度敏感、对成本敏感的使用场景。其价格仅为每百万 tokens 输入 $0.20、输出 $1.25,同时具备推理能力,Intelligence Index 达到 44.4,远高于同价位模型 20 的中位数——非常适合大规模分类、数据提取、排序以及子代理任务。
核心特性
- 极致成本效率:在当前 白B.AI 定价体系下,GPT-5.4 Nano 是 GPT-5.4 系列中成本最低的选项之一,适合高并发、低延迟的生产场景。
- 高速推理:生成速度约为 221.8 tokens/秒,首 token 时间为 3.72 秒,适合实时系统。
- 推理模型:尽管是最小版本,GPT-5.4 Nano 仍然是一个具备延展思考 / chain-of-thought 推理能力的推理模型。
- 多模态输入:支持文本和图像输入,适用于轻量级多模态任务,例如视觉分类和图像分析。
- 400K 上下文窗口:与 Mini 相同,支持 400,000 token 的上下文窗口,具备充足的输入容量。
适用场景
- 分类与数据提取:这是 OpenAI 官方推荐的核心使用场景,在结构化数据处理、文本分类和信息提取方面表现可靠。
- 代码子代理:适合在多代理架构中处理较简单的辅助任务,例如代码格式化、lint 检查和小规模代码生成。
- 实时系统与高吞吐流水线:超低延迟与低成本的组合,使其非常适合后台任务、实时排序和大规模自动化流水线。
- 分布式代理架构:可作为分布式代理系统中的边缘执行节点,尽可能降低单次调用成本与延迟。
能力与限制
| 能力 | 详细说明 |
|---|
| 推理能力 | Intelligence Index 为 44.4(同价位模型中位数为 20),具备 chain-of-thought 推理能力,但在复杂多步问题上弱于 Mini 和 Standard。 |
| 创作能力 | 适合短文本生成和模板填充;不适合长文本写作或需要深度推理的创作任务。 |
| 多模态能力 | 支持文本和图像输入、文本输出;适合基础图像分类和识别,更复杂的图像分析更适合由更大的模型处理。 |
| 响应速度 | 非常快——约 221.8 tokens/秒,首 token 时间 3.72 秒,是 GPT-5.4 系列中速度最快的模型。 |
| 上下文窗口 | 400,000 tokens |
| 最大输出 | 官方未明确说明 |
| 知识截止时间 | 2025 年 8 月 31 日 |
积分与定价
| 模型 | 输入(Credits/Token) | 输出(Credits/Token) |
|---|
| GPT-5.4 Nano | 0.20 | 1.20 |