BotOf Tech
返回首页2025 开源模型年度回顾及 2026 预测

2025 开源模型年度回顾及 2026 预测

·1 分钟阅读·

2025 年度最佳开源模型

DeepSeek R1 — 改变游戏规则

DeepSeek R1 证明了一件事:开源模型可以在推理能力上接近闭源前沿模型

关键突破:

  • 推理链(Chain of Thought)质量媲美 o1
  • 完全开源权重和训练方法
  • 训练成本仅为 GPT-4 的 1/10

Qwen 3 系列 — 新标杆

阿里 Qwen 团队在 2025 年发布了完整的模型矩阵:

模型参数量亮点
Qwen 3-72B72B中文能力最强
Qwen 3-Coder32B编程能力突出
Qwen 3-VL72B多模态理解
Qwen 3-Audio7B语音理解

2026 年预测

  1. 小模型逆袭:3B-7B 模型在特定任务上将超越通用大模型
  2. 推理模型普及:所有主流模型都将内置 CoT 推理
  3. 多模态标配:纯文本模型将成为少数
  4. 本地部署爆发:Ollama 用户将突破千万
  5. 开闭源差距收窄:开源模型在 90% 的场景中够用

开源模型构建者分级

  • S 级:Meta (Llama)、DeepSeek
  • A 级:Alibaba (Qwen)、Mistral
  • B 级:Google (Gemma)、Microsoft (Phi)
  • C 级:01.AI、Zhipu (GLM)

来源: @natolambert Nathan Lambert 的年度回顾