跳到主要内容

Qwen3.6-27B

概述

Qwen3.6-27B FP8 是由 Alibaba Qwen Team 开发的 270 亿参数稠密多模态模型。该模型面向 Agentic Coding 和复杂推理任务优化,同时具备较强的生产部署实用性。在 B.AI 上,Qwen3.6-27B 适用于代码辅助、技术推理、多模态理解和工具辅助工作流。具体输入模态、上下文长度和工具能力可能会随 B.AI 模型目录和平台配置调整。

核心特性

  • Hybrid Gated DeltaNet Architecture:采用混合注意力设计,将高效的线性注意力类层与完整自注意力层结合,在推理效率和长上下文表现之间取得平衡。
  • 原生多模态能力:模型层面支持文本、图像和视频输入,具体以 B.AI 平台配置和可用状态为准。
  • Hybrid Thinking Mode:在可用场景下支持 thinking 与 non-thinking 两种响应模式,可根据任务需求调整质量、速度和成本之间的平衡。
  • Thinking Preservation:面向多轮对话保留推理上下文,有助于提升 Agentic Coding 工作流中的连贯性。
  • Multi-Token Prediction (MTP):采用多 token 预测训练方式,以提升推理吞吐效率。

适用场景

  • Agentic Coding:适合自主代码生成、调试和多步骤软件工程工作流。
  • 复杂推理任务:适合科学、数学、工程和分析类问题求解。
  • 多模态分析:在相关输入模态启用时,可用于文档、截图、图表、示意图、图像和视频理解。
  • 生产工作负载:适合需要兼顾能力、延迟和使用成本的实际业务场景。

能力与限制

能力维度说明
推理能力适合技术、分析和结构化问题求解的强推理能力
编程能力适合代码生成、调试、重构和 Agentic 软件工作流
创意写作支持通用文本生成;主要优化方向是代码和推理,而非创意写作
多模态能力模型层面支持文本、图像和视频输入;输出为文本
上下文窗口最高 128k tokens,具体以平台配置为准
最大输出最高 32,768 tokens,具体以平台配置为准
工具调用在启用时支持原生函数调用和工具使用

已知限制

  • 具体能力可用性可能取决于 B.AI 集成、供应商支持、套餐配置和功能上线状态。
  • 视频输入、工具调用、长上下文上限及其他高级能力需要兼容的平台配置支持。
  • 公开评测、第三方对比、策略行为和实现细节可能随时间变化,因此本文档不将其作为固定承诺。

Pricing

模型名称输入 (Credits/Token)Cache Write (Credits/Token)Cache Read (Credits/Token)输出 (Credits/Token)网页搜索(Credits/次)计费说明
Qwen3.6-27B0.190.190.192.99-缓存读取和缓存写入按相同价格计费。
价格说明

文档价格为 B.AI 平台模型标准参考价,仅供基础计费说明使用。B.AI 可能会通过充值赠送及账户权益等方式,为用户提供更低的实际使用成本。具体价格、赠送积分及账户权益请以平台页面展示及最终账单为准。