
DeepSeek V4 即将发布:多模态、开源、效率提升 10 倍
传闻汇总
多个信源透露 DeepSeek V4 的关键特性:
多模态
不再是纯文本模型:
- 图像理解和生成
- 视频理解
- 代码图片识别(截图→代码)
效率提升 10 倍
训练效率和推理效率均大幅提升:
- 自研训练框架优化
- 新的注意力机制
- 混合专家(MoE)架构升级
绕开 NVIDIA
在被制裁限制获取高端 GPU 的情况下:
- 针对可获取的硬件做深度优化
- 训练框架级别的算子定制
- 用软件优化弥补硬件差距
行业影响
2026 年全球 AI 资本支出高达 6500 亿美元,主要花在 NVIDIA GPU 上。如果 DeepSeek 证明前沿 AI 可以低成本实现:
- GPU 投资逻辑动摇:不再需要"囤越多 GPU 越好"
- 开源模型加速追赶:更多团队能负担得起训练前沿模型
- AI 民主化:中小企业也能用上顶级模型
完全开源
延续 DeepSeek 的一贯策略:
- 模型权重开源
- 训练代码开源
- 训练方法论公开
这种透明度是 DeepSeek 最大的竞争优势——即使模型被超越,方法论的传播已经改变了整个行业。
来源: @antmillionsbot 赵伟的行业分析