Qwen3.6-27B
概述
Qwen3.6-27B FP8 是由 Alibaba Qwen Team 开发的 270 亿参数稠密多模态模型。该模型面向 Agentic Coding 和复杂推理任务优化,同时具备较强的生产部署实用性。在 B.AI 上,Qwen3.6-27B 适用于代码辅助、技术推理、多模态理解和工具辅助工作流。具体输入模态、上下文长度和工具能力可能会随 B.AI 模型目录和平台配置调整。
核心特性
- Hybrid Gated DeltaNet Architecture:采用混合注意力设计,将高效的线性注意力类层与完整自注意力层结合,在推理效率和长上下文表现之间取得平衡。
- 原生多模态能力:模型层面支持文本、图像和视频输入,具体以 B.AI 平台配置和可用状态为准。
- Hybrid Thinking Mode:在可用场景下支持 thinking 与 non-thinking 两种响应模式,可根据任务需求调整质量、速度和成本之间的平衡。
- Thinking Preservation:面向多轮对话保留推理上下文,有助于提升 Agentic Coding 工作流中的连贯性。
- Multi-Token Prediction (MTP):采用多 token 预测训练方式,以提升推理吞吐效率。
适用场景
- Agentic Coding:适合自主代码生成、调试和多步骤软件工程工作流。
- 复杂推理任务:适合科学、数学、工程和分析类问题求解。
- 多模态分析:在相关输入模态启用时,可用于文档、截图、图表、示意图、图像和视频理解。
- 生产工作负载:适合需要兼顾能力、延迟和使用成本的实际业务场景。
能力与限制
| 能力维度 | 说明 |
|---|---|
| 推理能力 | 适合技术、分析和结构化问题求解的强推理能力 |
| 编程能力 | 适合代码生成、调试、重构和 Agentic 软件工作流 |
| 创意写作 | 支持通用文本生成;主要优化方向是代码和推理,而非创意写作 |
| 多模态能力 | 模型层面支持文本、图像和视频输入;输出为文本 |
| 上下文窗口 | 最高 128k tokens,具体以平台配置为准 |
| 最大输出 | 最高 32,768 tokens,具体以平台配置为准 |
| 工具调用 | 在启用时支持原生函数调用和工具使用 |
已知限制
- 具体能力可用性可能取决于 B.AI 集成、供应商支持、套餐配置和功能上线状态。
- 视频输入、工具调用、长上下文上限及其他高级能力需要兼容的平台配置支持。
- 公开评测、第三方对比、策略行为和实现细节可能随时间变化,因此本文档不将其作为固定承诺。
Pricing
| 模型名称 | 输入 (Credits/Token) | Cache Write (Credits/Token) | Cache Read (Credits/Token) | 输出 (Credits/Token) | 网页搜索(Credits/次) | 计费说明 |
|---|---|---|---|---|---|---|
| Qwen3.6-27B | 0.19 | 0.19 | 0.19 | 2.99 | - | 缓存读取和缓存写入按相同价格计费。 |
价格说明
文档价格为 B.AI 平台模型标准参考价,仅供基础计费说明使用。B.AI 可能会通过充值赠送及账户权益等方式,为用户提供更低的实际使用成本。具体价格、赠送积分及账户权益请以平台页面展示及最终账单为准。