DeepSeek惊艳世界，算力与应用将迎来结构性变化

2025-02-21ASPCMS社区 - fjmyhfvclm

今天分享的是：DeepSeek惊艳世界，算力与应用将迎来结构性变化

报告共计：18页

《DeepSeek惊艳世界，算力与应用将迎来结构性变化》由东方证券撰写，探讨了DeepSeek发布的大模型DeepSeek-V3和推理模型R1对AI行业的影响。

1. 模型性能卓越且引发行业轰动：DeepSeek-V3在大模型主流榜单开源模型中位居榜首，与顶尖闭源模型性能相当，在知识、长文本、代码、数学等多领域测试成绩出色，生成速度大幅提升且API定价低。R1模型推理能力比肩OpenAI o1，开源多个模型并支持模型蒸馏，API服务性价比高。这两款模型训练成本极低，推出后使DeepSeek成为全球增速最快的AI应用，引发产业巨大反响，吸引众多科技领袖关注。

2. 技术创新多样：DeepSeek-V3在训练上，运用FP8精度训练、DualPipe双向流水线和跨节点通信技术降低成本；推理时，借助混合专家系统（MoE）和多头潜在注意力机制（MLA）提升效果，还通过多令牌预测（MTP）和模型蒸馏技术提高性能。R1-Zero尝试纯强化学习探索模型自主推理能力，R1则通过数据引导和多阶段优化，平衡推理性能与实用价值，其训练分冷启动、推理导向强化学习、拒绝采样+监督微调、全场景强化学习四个阶段。

3. 影响算力与应用格局：在算力方面，虽模型降低了训练端算力消耗，但训练算力长期仍有前景，各厂商会借鉴优化方法。推理成本下降将刺激推理算力需求增长，“杰文斯悖论”可能应验。同时，DeepSeek模型促使AI芯片行业格局面临变化，其开源性及对芯片要求的降低，给国产芯片带来机遇，若美国收紧芯片限制，也会影响国产芯片份额。在应用方面，此前AI应用普及和商业化存在困难，DeepSeek的强推理能力、低算力成本和开源属性，有望推动AI应用繁荣。加上其他国产模型的突破，为国内AI应用发展奠定良好基础。

以下为报告节选内容

报告共计： 18页

中小未来圈，你需要的资料，我这里都有！