DeepSeek惊艳世界,算力与应用将迎来结构性变化
今天分享的是:DeepSeek惊艳世界,算力与应用将迎来结构性变化
报告共计:18页
《DeepSeek惊艳世界,算力与应用将迎来结构性变化》由东方证券撰写,探讨了DeepSeek发布的大模型DeepSeek-V3和推理模型R1对AI行业的影响。
1. 模型性能卓越且引发行业轰动:DeepSeek-V3在大模型主流榜单开源模型中位居榜首,与顶尖闭源模型性能相当,在知识、长文本、代码、数学等多领域测试成绩出色,生成速度大幅提升且API定价低。R1模型推理能力比肩OpenAI o1,开源多个模型并支持模型蒸馏,API服务性价比高。这两款模型训练成本极低,推出后使DeepSeek成为全球增速最快的AI应用,引发产业巨大反响,吸引众多科技领袖关注。
2. 技术创新多样:DeepSeek-V3在训练上,运用FP8精度训练、DualPipe双向流水线和跨节点通信技术降低成本;推理时,借助混合专家系统(MoE)和多头潜在注意力机制(MLA)提升效果,还通过多令牌预测(MTP)和模型蒸馏技术提高性能。R1-Zero尝试纯强化学习探索模型自主推理能力,R1则通过数据引导和多阶段优化,平衡推理性能与实用价值,其训练分冷启动、推理导向强化学习、拒绝采样+监督微调、全场景强化学习四个阶段 。
3. 影响算力与应用格局:在算力方面,虽模型降低了训练端算力消耗,但训练算力长期仍有前景,各厂商会借鉴优化方法。推理成本下降将刺激推理算力需求增长,“杰文斯悖论”可能应验。同时,DeepSeek模型促使AI芯片行业格局面临变化,其开源性及对芯片要求的降低,给国产芯片带来机遇,若美国收紧芯片限制,也会影响国产芯片份额。在应用方面,此前AI应用普及和商业化存在困难,DeepSeek的强推理能力、低算力成本和开源属性,有望推动AI应用繁荣。加上其他国产模型的突破,为国内AI应用发展奠定良好基础 。
以下为报告节选内容
报告共计: 18页
中小未来圈,你需要的资料,我这里都有!