gpt-5-4-mini

概述

GPT-5.4 Mini 是 OpenAI 于 2026 年 3 月 17 日发布的一款高性能轻量模型，可视为 GPT-5.4 的高效蒸馏版本。它在编程、推理、多模态理解和工具使用等方面相较 GPT-5 Mini 有显著提升，同时运行速度提升超过 2 倍，成本约为标准版模型的 1/6，非常适合高吞吐量场景。

核心特性

接近旗舰级性能：在 SWE-Bench Pro 上达到 54.38%，与标准版模型的 57.7% 非常接近，而成本仅约为其 1/6。
强大的科学推理能力：在 GPQA Diamond 上达到 87.5%，擅长研究生水平的科学推理任务。
完整工具支持：支持工具调用、联网搜索、图像分析以及原生计算机操作（Native Computer Use），完整保留核心能力。
速度提升超过 2 倍：相比 GPT-5 Mini，运行速度提升超过 2 倍，适用于对延迟敏感的场景。
400K 上下文窗口：支持 400,000 token 的上下文窗口，并支持视觉输入，适合处理中等规模的长文档。

最佳使用场景

编程助手与子代理（Sub-Agents）：在编程基准测试中接近旗舰模型性能，能够以更低成本提供可靠的代码生成与修复能力。
实时 AI 应用：速度提升超过 2 倍，使其非常适合聊天机器人、实时翻译和交互式编程助手等场景。
高吞吐数据处理：兼具低成本与高性能，适合大规模文档分类、内容审核和数据提取流水线。
桌面自动化代理：完整支持原生计算机操作能力，可用于构建中等复杂度的桌面自动化工作流。

能力与局限

能力	详细说明
推理能力	SWE-Bench Pro 54.38%，GPQA Diamond 87.5%；推理能力很强，但在最复杂的多步骤问题上仍略逊于标准版模型。
创作能力	能够胜任大多数日常文本与代码生成任务；但对于需要极深层推理的创作任务，能力仍弱于标准版模型。
多模态能力	支持文本和图像输入、文本输出；相比 GPT-5 Mini，在多模态理解和图像分析方面有显著提升。
响应速度	很快——相比 GPT-5 Mini 提升超过 2 倍，适合对延迟敏感的应用场景。
上下文窗口	400,000 tokens
最大输出	官方尚未明确公布，估计约为 16,000–32,000 tokens
知识截止时间	2025 年 8 月 31 日

积分消耗

模型名称	输入 (Credits/Token)	Cache Write (Credits/Token)	Cache Read (Credits/Token)	输出 (Credits/Token)	网页搜索（Credits/次）	计费说明
GPT-5.4 Mini	`0.75`	`0.75`	`0.075`	`4.50`	`10,000`	-

价格说明

文档价格为 B.AI 平台模型标准参考价，仅供基础计费说明使用。B.AI 可能会通过充值赠送及账户权益等方式，为用户提供更低的实际使用成本。具体价格、赠送积分及账户权益请以平台页面展示及最终账单为准。

概述​

核心特性​

最佳使用场景​

能力与局限​

积分消耗​

概述

核心特性

最佳使用场景

能力与局限

积分消耗