跳到主要内容

GPT-5.4 Nano

概述

GPT-5.4 Nano 是 GPT-5.4 系列中体量最小、成本最低的版本,于 2026 年 3 月 17 日发布,面向对速度敏感、对成本敏感的使用场景。其价格仅为每百万 tokens 输入 $0.20、输出 $1.25,同时具备推理能力,Intelligence Index 达到 44.4,远高于同价位模型 20 的中位数——非常适合大规模分类、数据提取、排序以及子代理任务。

核心特性

  • 极致成本效率:在当前 白B.AI 定价体系下,GPT-5.4 Nano 是 GPT-5.4 系列中成本最低的选项之一,适合高并发、低延迟的生产场景。
  • 高速推理:生成速度约为 221.8 tokens/秒,首 token 时间为 3.72 秒,适合实时系统。
  • 推理模型:尽管是最小版本,GPT-5.4 Nano 仍然是一个具备延展思考 / chain-of-thought 推理能力的推理模型。
  • 多模态输入:支持文本和图像输入,适用于轻量级多模态任务,例如视觉分类和图像分析。
  • 400K 上下文窗口:与 Mini 相同,支持 400,000 token 的上下文窗口,具备充足的输入容量。

适用场景

  • 分类与数据提取:这是 OpenAI 官方推荐的核心使用场景,在结构化数据处理、文本分类和信息提取方面表现可靠。
  • 代码子代理:适合在多代理架构中处理较简单的辅助任务,例如代码格式化、lint 检查和小规模代码生成。
  • 实时系统与高吞吐流水线:超低延迟与低成本的组合,使其非常适合后台任务、实时排序和大规模自动化流水线。
  • 分布式代理架构:可作为分布式代理系统中的边缘执行节点,尽可能降低单次调用成本与延迟。

能力与限制

能力详细说明
推理能力Intelligence Index 为 44.4(同价位模型中位数为 20),具备 chain-of-thought 推理能力,但在复杂多步问题上弱于 Mini 和 Standard。
创作能力适合短文本生成和模板填充;不适合长文本写作或需要深度推理的创作任务。
多模态能力支持文本和图像输入、文本输出;适合基础图像分类和识别,更复杂的图像分析更适合由更大的模型处理。
响应速度非常快——约 221.8 tokens/秒,首 token 时间 3.72 秒,是 GPT-5.4 系列中速度最快的模型。
上下文窗口400,000 tokens
最大输出官方未明确说明
知识截止时间2025 年 8 月 31 日

积分与定价

模型输入(Credits/Token)输出(Credits/Token)
GPT-5.4 Nano0.201.20