Gemini 3.5 Flash
概述
Gemini 3.5 Flash 是 Gemini 3 系列中的 Flash 层级模型。它面向低延迟、高性价比的使用场景,同时保留较强的推理、编码和多模态理解能力。
在 B.AI 中,请使用模型 ID:gemini-3.5-flash。
核心特性
- 智能体执行: 适合子智能体部署、多步骤工作流,以及大规模快速智能体循环
- 编码支持: 适用于迭代式编码、快速探索和原型开发等需要快速反馈的场景
- 可配置思考等级: 支持
minimal、low、medium、high四个思考等级,默认等级为medium - 组合工具调用: 支持 function calling、code execution、Google Search grounding、URL context 和 structured outputs
适用场景
- 大规模智能体工作流: 适合需要持续推进任务、频繁调用工具的生产级智能体系统
- 快速编码迭代: 适合开发者工具、代码生成流水线、调试辅助和交互式原型开发
- 高性价比智能能力: 适合需要兼顾速度、能力和成本的高频生产工作负载
能力与限制
| 能力 | 说明 |
|---|---|
| 推理能力 | 具备较强推理能力,可通过思考等级在质量、延迟和成本之间进行取舍 |
| 编码能力 | 针对迭代式编码和智能体编码工作流进行优化 |
| 多模态能力 | 支持文本、图像、视频、音频和 PDF 输入,输出为文本 |
| 响应速度 | Flash 层级延迟,并支持 minimal 思考等级以获得更快的对话式响应 |
| 上下文窗口 | 支持最高 1,048,576 tokens 的上下文窗口 |
| 最大输出 | 支持最高 65,536 tokens 输出 |
| 工具调用 | 支持 function calling、code execution、Google Search grounding、URL context 和 structured outputs |
| 多语言能力 | 支持主要语言的多语言任务 |
积分消耗
| 模型名称 | 输入 (Credits/Token) | Cache Write (Credits/Token) | Cache Read (Credits/Token) | 输出 (Credits/Token) | 网页搜索(Credits/次) | 计费说明 |
|---|---|---|---|---|---|---|
| Gemini 3.5 Flash | 1.50 | 1.50 | 0.15 | 9.00 | 14,000 | - |