GPT-5.4 Mini
GPT-5.4 Mini 是 OpenAI 于 2026 年 3 月 17 日发布的一款高性能轻量模型,可视为 GPT-5.4 的高效蒸馏版本。它在编程、推理、多模态理解和工具使用等方面相较 GPT-5 Mini 有显著提升,同时运行速度提升超过 2 倍,成本约为标准版模型的 1/6,非常适合高吞吐量场景。
核心特性
- 接近旗舰级性能:在 SWE-Bench Pro 上达到 54.38%,与标准版模型的 57.7% 非常接近,而成本仅约为其 1/6。
- 强大的科学推理能力:在 GPQA Diamond 上达到 87.5%,擅长研究生水平的科学推理任务。
- 完整工具支持:支持工具调用、联网搜索、图像分析以及原生计算机操作(Native Computer Use),完整保留核心能力。
- 速度提升超过 2 倍:相比 GPT-5 Mini,运行速度提升超过 2 倍,适用于对延迟敏感的场景。
- 400K 上下文窗口:支持 400,000 token 的上下文窗口,并支持视觉输入,适合处理中等规模的长文档。
适用场景
- 编程助手与子代理(Sub-Agents):在编程基准测试中接近旗舰模型性能,能够以更低成本提供可靠的代码生成与修复能力。
- 实时 AI 应用:速度提升超过 2 倍,使其非常适合聊天机器人、实时翻译和交互式编程助手等场景。
- 高吞吐数据处理:兼具低成本与高性能,适合大规模文档分类、内容审核和数据提取流水线。
- 桌面自动化代理:完整支持原生计算机操作能力,可用于构建中等复杂度的桌面自动化工作流。
能力与限制
| 能力 | 详细说明 |
|---|
| 推理能力 | SWE-Bench Pro 54.38%,GPQA Diamond 87.5%;推理能力很强,但在最复杂的多步骤问题上仍略逊于标准版模型。 |
| 创作能力 | 能够胜任大多数日常文本与代码生成任务;但对于需要极深层推理的创作任务,能力仍弱于标准版模型。 |
| 多模态能力 | 支持文本和图像输入、文本输出;相比 GPT-5 Mini,在多模态理解和图像分析方面有显著提升。 |
| 响应速度 | 很快——相比 GPT-5 Mini 提升超过 2 倍,适合对延迟敏感的应用场景。 |
| 上下文窗口 | 400,000 tokens |
| 最大输出 | 官方尚未明确公布,估计约为 16,000–32,000 tokens |
| 知识截止时间 | 2025 年 8 月 31 日 |
积分与定价
| 模型 | 输入(Credits/Token) | 输出(Credits/Token) |
|---|
| GPT-5.4 Mini | 0.75 | 4.50 |