gpt-5-4-nano

概述

GPT-5.4 Nano 是 GPT-5.4 系列中体量最小、成本最低的版本，于 2026 年 3 月 17 日发布，面向对速度敏感、对成本敏感的使用场景。其价格仅为每百万 tokens 输入 $0.20、输出 $1.25，同时具备推理能力，Intelligence Index 达到 44.4，远高于同价位模型 20 的中位数——非常适合大规模分类、数据提取、排序以及子代理任务。

核心特性

极致成本效率：每 100 万输入 tokens $0.20 + 每 100 万输出 tokens $1.25，按 3:1 输入输出比例计算，综合成本仅为每 100 万 tokens $0.46——是 GPT-5.4 系列中最便宜的选项。
高速推理：生成速度约为 221.8 tokens/秒，首 token 时间为 3.72 秒，适合实时系统。
推理模型：尽管是最小版本，GPT-5.4 Nano 仍然是一个具备延展思考 / chain-of-thought 推理能力的推理模型。
多模态输入：支持文本和图像输入，适用于轻量级多模态任务，例如视觉分类和图像分析。
400K 上下文窗口：与 Mini 相同，支持 400,000 token 的上下文窗口，具备充足的输入容量。

最佳使用场景

分类与数据提取：这是 OpenAI 官方推荐的核心使用场景，在结构化数据处理、文本分类和信息提取方面表现可靠。
代码子代理：适合在多代理架构中处理较简单的辅助任务，例如代码格式化、lint 检查和小规模代码生成。
实时系统与高吞吐流水线：超低延迟与低成本的组合，使其非常适合后台任务、实时排序和大规模自动化流水线。
分布式代理架构：可作为分布式代理系统中的边缘执行节点，尽可能降低单次调用成本与延迟。

能力与局限

能力	详细说明
推理能力	Intelligence Index 为 44.4（同价位模型中位数为 20），具备 chain-of-thought 推理能力，但在复杂多步问题上弱于 Mini 和 Standard。
创作能力	适合短文本生成和模板填充；不适合长文本写作或需要深度推理的创作任务。
多模态能力	支持文本和图像输入、文本输出；适合基础图像分类和识别，更复杂的图像分析更适合由更大的模型处理。
响应速度	非常快——约 221.8 tokens/秒，首 token 时间 3.72 秒，是 GPT-5.4 系列中速度最快的模型。
上下文窗口	400,000 tokens
最大输出	官方未明确说明
知识截止时间	2025 年 8 月 31 日

Credits 与定价

模型	输入（每 100 万 tokens）	输出（每 100 万 tokens）
GPT-5.4 Nano	$0.20	$1.25

积分消耗

模型名称	输入 (Credits/Token)	Cache Write (Credits/Token)	Cache Read (Credits/Token)	输出 (Credits/Token)	网页搜索（Credits/次）	计费说明
GPT-5.4 Nano	`0.20`	`0.20`	`0.02`	`1.25`	`10,000`	-

价格说明

文档价格为 B.AI 平台模型标准参考价，仅供基础计费说明使用。B.AI 可能会通过充值赠送及账户权益等方式，为用户提供更低的实际使用成本。具体价格、赠送积分及账户权益请以平台页面展示及最终账单为准。

概述​

核心特性​

最佳使用场景​

能力与局限​

Credits 与定价​

积分消耗​

概述

核心特性

最佳使用场景

能力与局限

Credits 与定价

积分消耗