智通财经APP获悉,继Qwen3.6-Plus发布之后 ,阿里巴巴(09988)千问大模型团队分享下一代旗舰模型的早期预览版:Qwen3.6-Max-Preview相比Qwen3.6-Plus,本次预览版带来了更强的世界知识和指令遵循能力,以及在多项基准上显著提升的智能体编程表现 。作为预览版 ,模型仍在积极迭代中,后续版本将持续优化。Qwen3.6-Max-Preview主要特性包括:相比Qwen3.6-Plus显著提升的智能体编程能力;更强的世界知识和指令遵循;更优的真实场景智能体与知识可靠性表现。

模型性能
以下展示了 Qwen3.6-Max-Preview 与主流前沿模型的评测对比 。相比 Qwen3.6-Plus,预览版在智能体编程方面取得显著提升(如 SkillsBench +9.9 、SciCode +10.8、NL2Repo +5.0、Terminal-Bench 2.0 +3.8) ,世界知识更强(SuperGPQA +2.3 、QwenChineseBench +5.3),指令遵循也更优(ToolcallFormatIFBench +2.8)。在权威三方评测Artificial Analysis刚刚更新的大模型榜单中,Qwen3.6-Max-Preview性能表现超过GLM5.1、MiniMax-M2.7等模型 ,登顶最佳国产模型。

开始使用Qwen3.6-Max-Preview
Qwen3.6-Max-Preview将通过阿里云百炼 API 提供,模型名称为 qwen3.6-max-preview 。您也可以在 Qwen Studio 上即时体验。
API更新
阿里云百炼支持行业标准协议,兼容 OpenAI 规范的聊天补全(chat completions)和响应(responses)API,以及兼容 Anthropic 的 API 接口。
本次发布支持 preserve_thinking 功能:在消息中保留所有前序轮次的思维内容 ,推荐用于智能体任务 。
总结
Qwen3.6-Max-Preview 是千问大模型下一代旗舰模型的早期预览版,在智能体编程、世界知识和指令遵循方面相比 Qwen3.6-Plus 均有显著提升。它在六项主要编程基准上取得最高分――SWE-bench Pro 、Terminal-Bench 2.0、SkillsBench、QwenClawBench 、QwenWebBench 和 SciCode――相比前代有大幅进步。同时在知识(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表现更优。
作为预览版,Qwen3.6-Max-Preview仍在积极开发中 。千问大模型团队将持续迭代模型 ,后续版本将带来进一步提升。
目前,千问3.6系列已推出Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash,并开源Qwen3.6-35B-A3B。其中 ,Qwen3.6-Plus登顶全球最大的三方API调用平台OpenRouter的日榜 、周榜、趋势榜冠军,Qwen3.6-35B-A3B则登顶HuggingFace全球开源大模型榜单冠军,千问3.6成为当下最受企业和开发者欢迎的大模型 。