跳到主要内容

Gemini 3.5 Flash

概述

Gemini 3.5 Flash 是 Gemini 3 系列中的 Flash 层级模型。它面向低延迟、高性价比的使用场景,同时保留较强的推理、编码和多模态理解能力。

在 B.AI 中,请使用模型 ID:gemini-3.5-flash


核心特性

  • 智能体执行: 适合子智能体部署、多步骤工作流,以及大规模快速智能体循环
  • 编码支持: 适用于迭代式编码、快速探索和原型开发等需要快速反馈的场景
  • 可配置思考等级: 支持 minimallowmediumhigh 四个思考等级,默认等级为 medium
  • 组合工具调用: 支持 function calling、code execution、Google Search grounding、URL context 和 structured outputs

适用场景

  • 大规模智能体工作流: 适合需要持续推进任务、频繁调用工具的生产级智能体系统
  • 快速编码迭代: 适合开发者工具、代码生成流水线、调试辅助和交互式原型开发
  • 高性价比智能能力: 适合需要兼顾速度、能力和成本的高频生产工作负载

能力与限制

能力说明
推理能力具备较强推理能力,可通过思考等级在质量、延迟和成本之间进行取舍
编码能力针对迭代式编码和智能体编码工作流进行优化
多模态能力支持文本、图像、视频、音频和 PDF 输入,输出为文本
响应速度Flash 层级延迟,并支持 minimal 思考等级以获得更快的对话式响应
上下文窗口支持最高 1,048,576 tokens 的上下文窗口
最大输出支持最高 65,536 tokens 输出
工具调用支持 function calling、code execution、Google Search grounding、URL context 和 structured outputs
多语言能力支持主要语言的多语言任务

积分消耗

模型名称输入 (Credits/Token)Cache Write (Credits/Token)Cache Read (Credits/Token)输出 (Credits/Token)网页搜索(Credits/次)计费说明
Gemini 3.5 Flash1.501.500.159.0014,000-