Qwen3.6-27B

概述

Qwen3.6-27B FP8 是由 Alibaba Qwen Team 开发的 270 亿参数稠密多模态模型。该模型面向 Agentic Coding 和复杂推理任务优化，同时具备较强的生产部署实用性。在 B.AI 上，Qwen3.6-27B 适用于代码辅助、技术推理、多模态理解和工具辅助工作流。具体输入模态、上下文长度和工具能力可能会随 B.AI 模型目录和平台配置调整。

核心特性

Hybrid Gated DeltaNet Architecture：采用混合注意力设计，将高效的线性注意力类层与完整自注意力层结合，在推理效率和长上下文表现之间取得平衡。
原生多模态能力：模型层面支持文本、图像和视频输入，具体以 B.AI 平台配置和可用状态为准。
Hybrid Thinking Mode：在可用场景下支持 thinking 与 non-thinking 两种响应模式，可根据任务需求调整质量、速度和成本之间的平衡。
Thinking Preservation：面向多轮对话保留推理上下文，有助于提升 Agentic Coding 工作流中的连贯性。
Multi-Token Prediction (MTP)：采用多 token 预测训练方式，以提升推理吞吐效率。

适用场景

Agentic Coding：适合自主代码生成、调试和多步骤软件工程工作流。
复杂推理任务：适合科学、数学、工程和分析类问题求解。
多模态分析：在相关输入模态启用时，可用于文档、截图、图表、示意图、图像和视频理解。
生产工作负载：适合需要兼顾能力、延迟和使用成本的实际业务场景。

能力与限制

能力维度	说明
推理能力	适合技术、分析和结构化问题求解的强推理能力
编程能力	适合代码生成、调试、重构和 Agentic 软件工作流
创意写作	支持通用文本生成；主要优化方向是代码和推理，而非创意写作
多模态能力	模型层面支持文本、图像和视频输入；输出为文本
上下文窗口	最高 128k tokens，具体以平台配置为准
最大输出	最高 32,768 tokens，具体以平台配置为准
工具调用	在启用时支持原生函数调用和工具使用

已知限制

具体能力可用性可能取决于 B.AI 集成、供应商支持、套餐配置和功能上线状态。
视频输入、工具调用、长上下文上限及其他高级能力需要兼容的平台配置支持。
公开评测、第三方对比、策略行为和实现细节可能随时间变化，因此本文档不将其作为固定承诺。

Pricing

模型名称	输入 (Credits/Token)	Cache Write (Credits/Token)	Cache Read (Credits/Token)	输出 (Credits/Token)	网页搜索（Credits/次）	计费说明
Qwen3.6-27B	`0.19`	`0.19`	`0.19`	`2.99`	`-`	缓存读取和缓存写入按相同价格计费。

价格说明

文档价格为 B.AI 平台模型标准参考价，仅供基础计费说明使用。B.AI 可能会通过充值赠送及账户权益等方式，为用户提供更低的实际使用成本。具体价格、赠送积分及账户权益请以平台页面展示及最终账单为准。

Qwen3.6-27B

概述​

核心特性​

适用场景​

能力与限制​

已知限制​

Pricing​

概述

核心特性

适用场景

能力与限制

已知限制

Pricing