2025 开源模型年度回顾及 2026 预测

2025 开源模型年度回顾及 2026 预测

2026-01-10·1 分钟阅读·

2025 年度最佳开源模型

DeepSeek R1 — 改变游戏规则

DeepSeek R1 证明了一件事：开源模型可以在推理能力上接近闭源前沿模型。

关键突破：

推理链（Chain of Thought）质量媲美 o1
完全开源权重和训练方法
训练成本仅为 GPT-4 的 1/10

Qwen 3 系列 — 新标杆

阿里 Qwen 团队在 2025 年发布了完整的模型矩阵：

模型	参数量	亮点
Qwen 3-72B	72B	中文能力最强
Qwen 3-Coder	32B	编程能力突出
Qwen 3-VL	72B	多模态理解
Qwen 3-Audio	7B	语音理解

2026 年预测

小模型逆袭：3B-7B 模型在特定任务上将超越通用大模型
推理模型普及：所有主流模型都将内置 CoT 推理
多模态标配：纯文本模型将成为少数
本地部署爆发：Ollama 用户将突破千万
开闭源差距收窄：开源模型在 90% 的场景中够用

开源模型构建者分级

S 级：Meta (Llama)、DeepSeek
A 级：Alibaba (Qwen)、Mistral
B 级：Google (Gemma)、Microsoft (Phi)
C 级：01.AI、Zhipu (GLM)

来源: @natolambert Nathan Lambert 的年度回顾

← 返回所有文章