阿里通义大模型团队正式开源Qwen3-Coder,凭借强大性能,刷新AI编程领域SOTA(State of the Art,当前最佳水平),成为国产开源编程模型的里程碑。

Qwen3-Coder是一款480B参数激活35B参数的MoE模型,原生支持256K token上下文,通过YaRN技术能扩展至1M token。在性能上,不仅超过开源领域的DeepSeek V3和Kimi K2,还超越闭源的业界标杆Claude Sonnet 4。

Qwen3-Coder开源且免费,开发者无需每月花费200美元购买Claude Code服务,就能使用这款高性能编程模型。

• 用简单提示词,能生成p5js的多彩可交互动画、小球弹跳效果。

• 开发Wordle单词游戏(规则为6次尝试猜出5个字母的单词),交付的游戏页面和源代码可直接使用。

• 打造找不同游戏,相比同日发布的Qwen3-235B-A22B-2507,在审美和完成度上更优。

• 构建可互动的太阳系模拟,行星间关系基本准确。

Qwen3-Coder在指令遵循、UI设计、动画制作等方面能力突出,多数测试结果一次跑通,无需额外推理。

预训练

• 数据扩展:训练数据达7.5T tokens,其中70%为代码数据,为编程能力打下坚实基础。

• 上下文扩展:原生支持256K上下文,还能扩展至1M,能处理更长文本和更复杂任务。

• 合成数据扩展:借助Qwen2.5-Coder清洗和重写低质量数据,提升训练数据整体质量。

后训练

• Scaling Code RL:在丰富真实的代码任务上进行大规模强化学习训练,自动生成多样化测试用例,显著提高代码执行成功率。

• Scaling Long-Horizon RL:依托阿里云基础设施,构建可同时运行20000个独立环境的系统,让模型在多轮交互中表现出色,尤其在SWE-bench Verified上达到开源模型SOTA。

行业影响

Qwen3-Coder的发布,被认为是开源编程Agent领域的重大飞跃。有网友预测,开源代码生成可能在几个月内超越闭源SOTA。而阿里开源这款高水平编程模型,也标志着中国开源模型在代码能力上已跻身全球前列。

如果想体验或了解更多,可访问官网( chat.qwen.ai )或GitHub项目( github.com/QwenLM/qwen-code )。

Copyright ©笔电社bidianshe#outlook.com