北大:DeepSeek与AIGC应用(98页附完整文档下载)
2025-03-04
该文档是 AI 肖睿团队关于 DeepSeek 与 AIGC 应用的讲座内容,围绕 DeepSeek-R1 模型和 AIGC 展开,介绍了相关概念、技术原理、应用场景、工具选择等知识,助力读者了解其价值并合理应用。完整文档下载请️关注数智科技说公众号后回复“20250301”。
- ️DeepSeek-R1 模型详解
- ️模型概述:由深度求索公司 2025 年 1 月 20 日推出,源于知名私募巨头支持,专注开发大语言模型及相关技术。它在复杂推理任务表现优异,打破传统大模型发展路径,训练成本低、推理能力强且全部开源。
- ️技术原理与版本:通过思维链、强化学习和蒸馏技术实现复杂推理。有满血版和蒸馏版等多个版本,满血版性能强,不同版本在能力和应用场景上有差异,部署需特定算力支持。
- ️优势与局限:优势在于理科能力和复杂任务处理能力强;局限是通用和生成能力弱,幻觉明显,处理非中英文问题有语言混杂现象,特定提示会降低性能。
- ️应用场景与使用方式:适用于推理密集型、教育科研、文档分析、开放领域问答写作等任务。可通过官方网站、app 及众多第三方接入产品使用。
- ️AIGC 的概念和应用
- ️基本概念:人工智能生成内容,与 AI、AGI 等概念相关,经历了早期萌芽、沉淀积累和快速发展阶段,深度学习推动其广泛应用。
- ️应用领域:在文本、图像、音频、视频生成方面应用广泛,如写作、绘画、音乐创作、视频特效等。在电商、新闻传媒、影视、游戏、教育、金融等行业可提升效率、降本增效和增强创新。
- ️挑战与未来趋势:面临数据隐私、伦理、生成质量控制和就业结构变化等挑战。未来将提升生成质量,拓展应用领域,加强人机协作和监管。
- ️AIGC 的能力揭秘
- 文本生成原理(以 GPT-4o 为例):基于 Transformer 架构,通过上下文编码和自注意力机制处理输入,经预训练和微调学习知识。具备多轮对话、语言转换等能力,但存在知识局限、上下文窗口限制和生成幻觉等问题。
- 图像生成原理(以 Stable Diffusion 为例):由文本编码器、图像信息生成器和图像解码器组成。将文本描述转化为高维向量,逐步处理生成图像,文生图有优势也有精确控制困难、随机性强等局限。
- ️选择 AIGC 工具
- ️工具类型与代表产品:包括聊天对话、图像生成、音频视频生成、搜索工具等,国内外有众多代表性工具,如 DeepSeek、豆包、Kimi 等。
- ️工具特点与适用场景:不同工具在推理能力、多模态支持、长文本处理和搜索效率等方面存在差异。DeepSeek-R1 文本推理强,豆包多模态和语音情感能力强,Kimi 多模态、超长文本处理和搜索推理能力强 。
- ️选择依据与使用建议:选择时需明确需求、评估性能和考虑成本。使用时要明确目标,建立清单,在实践中测试筛选并定期更新工具列表。
完整文档下载请️关注数智科技说公众号后回复“20250301”。
北京大学发布《DeepSeek提示词工程和落地场景》(附完整文档下载)