跳到主要内容

GPT-5.4 Mini

概述

GPT-5.4 Mini 是 OpenAI 于 2026 年 3 月 17 日发布的一款高性能轻量模型,可视为 GPT-5.4 的高效蒸馏版本。它在编程、推理、多模态理解和工具使用等方面相较 GPT-5 Mini 有显著提升,同时运行速度提升超过 2 倍,成本约为标准版模型的 1/6,非常适合高吞吐量场景。

核心特性

  • 接近旗舰级性能:在 SWE-Bench Pro 上达到 54.38%,与标准版模型的 57.7% 非常接近,而成本仅约为其 1/6。
  • 强大的科学推理能力:在 GPQA Diamond 上达到 87.5%,擅长研究生水平的科学推理任务。
  • 完整工具支持:支持工具调用、联网搜索、图像分析以及原生计算机操作(Native Computer Use),完整保留核心能力。
  • 速度提升超过 2 倍:相比 GPT-5 Mini,运行速度提升超过 2 倍,适用于对延迟敏感的场景。
  • 400K 上下文窗口:支持 400,000 token 的上下文窗口,并支持视觉输入,适合处理中等规模的长文档。

适用场景

  • 编程助手与子代理(Sub-Agents):在编程基准测试中接近旗舰模型性能,能够以更低成本提供可靠的代码生成与修复能力。
  • 实时 AI 应用:速度提升超过 2 倍,使其非常适合聊天机器人、实时翻译和交互式编程助手等场景。
  • 高吞吐数据处理:兼具低成本与高性能,适合大规模文档分类、内容审核和数据提取流水线。
  • 桌面自动化代理:完整支持原生计算机操作能力,可用于构建中等复杂度的桌面自动化工作流。

能力与限制

能力详细说明
推理能力SWE-Bench Pro 54.38%,GPQA Diamond 87.5%;推理能力很强,但在最复杂的多步骤问题上仍略逊于标准版模型。
创作能力能够胜任大多数日常文本与代码生成任务;但对于需要极深层推理的创作任务,能力仍弱于标准版模型。
多模态能力支持文本和图像输入、文本输出;相比 GPT-5 Mini,在多模态理解和图像分析方面有显著提升。
响应速度很快——相比 GPT-5 Mini 提升超过 2 倍,适合对延迟敏感的应用场景。
上下文窗口400,000 tokens
最大输出官方尚未明确公布,估计约为 16,000–32,000 tokens
知识截止时间2025 年 8 月 31 日

积分与定价

模型输入(Credits/Token)输出(Credits/Token)
GPT-5.4 Mini0.754.50