
2025 开源模型年度回顾及 2026 预测
2025 年度最佳开源模型
DeepSeek R1 — 改变游戏规则
DeepSeek R1 证明了一件事:开源模型可以在推理能力上接近闭源前沿模型。
关键突破:
- 推理链(Chain of Thought)质量媲美 o1
- 完全开源权重和训练方法
- 训练成本仅为 GPT-4 的 1/10
Qwen 3 系列 — 新标杆
阿里 Qwen 团队在 2025 年发布了完整的模型矩阵:
| 模型 | 参数量 | 亮点 |
|---|---|---|
| Qwen 3-72B | 72B | 中文能力最强 |
| Qwen 3-Coder | 32B | 编程能力突出 |
| Qwen 3-VL | 72B | 多模态理解 |
| Qwen 3-Audio | 7B | 语音理解 |
2026 年预测
- 小模型逆袭:3B-7B 模型在特定任务上将超越通用大模型
- 推理模型普及:所有主流模型都将内置 CoT 推理
- 多模态标配:纯文本模型将成为少数
- 本地部署爆发:Ollama 用户将突破千万
- 开闭源差距收窄:开源模型在 90% 的场景中够用
开源模型构建者分级
- S 级:Meta (Llama)、DeepSeek
- A 级:Alibaba (Qwen)、Mistral
- B 级:Google (Gemma)、Microsoft (Phi)
- C 级:01.AI、Zhipu (GLM)
来源: @natolambert Nathan Lambert 的年度回顾