深度学习与大模型原理

01 0.5 天

神经网络与表示学习

本步 3 个知识点

学习目标

理解模型不是背知识库，而是在高维表示里学习模式。

先记这一句话

神经网络把输入变成一层层表示，越后面的表示越接近任务目标。

知识点清单与业务判断 先会用，再理解

1. 神经网络

知识点讲解由多层参数组成，通过训练调整参数来减少错误。

知识点详解

核心定义与工作原理

核心概念「神经网络」：由多层参数组成，通过训练调整参数来减少错误。

放到本步里理解这一点属于「神经网络与表示学习」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，神经网络才能变成可落地的 AI 能力。
什么时候要谨慎：边界要看模型是否有足够上下文、答案是否需要事实来源、生成错误是否会造成业务损失。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“由多层参数组成，通过训练调整参数来减少错误。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「神经网络」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

不要把模型理解成数据库，它更像模式匹配器。

2. 表示学习

知识点讲解模型把文本、图片、行为转成可计算表示。

知识点详解

核心定义与工作原理

核心概念「表示学习」：模型把文本、图片、行为转成可计算表示。

放到本步里理解这一点属于「神经网络与表示学习」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，表示学习才能变成可落地的 AI 能力。
什么时候要谨慎：边界要看模型是否有足够上下文、答案是否需要事实来源、生成错误是否会造成业务损失。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“模型把文本、图片、行为转成可计算表示。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「表示学习」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

判断场景时问：输入信息是否足够表达业务差异。

3. Embedding

知识点讲解Embedding 是语义或对象的向量表示，可用于相似度和检索。

知识点详解

核心定义与工作原理

核心概念「Embedding」：Embedding 是语义或对象的向量表示，可用于相似度和检索。

放到本步里理解这一点属于「神经网络与表示学习」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，Embedding 才能变成可落地的 AI 能力。
什么时候要谨慎：边界要看模型是否有足够上下文、答案是否需要事实来源、生成错误是否会造成业务损失。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“Embedding 是语义或对象的向量表示，可用于相似度和检索。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「Embedding」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

适合语义搜索、推荐、去重和聚类，不适合替代事实来源。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

找 3 个业务对象，说明它们可以如何被表示成特征或 embedding。

老师怎么判断你学会了

提交作业交一段解释：神经网络、表示学习和 embedding 分别解决什么。

合格能用非技术语言解释“表示”。
优秀能说清 embedding 适合相似度，不等于事实正确。
没通过把 embedding 说成万能记忆库。

02 1 天

Token、上下文与注意力

本步 3 个知识点

学习目标

理解 LLM 为什么受长度限制、为什么提示词会影响输出。

先记这一句话

LLM 看到的是 token 序列，回答质量很大程度取决于上下文质量。

知识点清单与业务判断 先会用，再理解

1. Token

知识点讲解模型把文本拆成 token 处理，成本和长度通常按 token 计算。

知识点详解

核心定义与工作原理

核心概念「Token」：Token 是模型处理文本的基本单位，可能是字、词或词片段。

放到本步里理解这一点属于「Token、上下文与注意力」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，Token 才能变成可落地的 AI 能力。
什么时候要谨慎：成本、速度、上下文长度都和 token 数有关。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“模型把文本拆成 token 处理，成本和长度通常按 token 计算。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「Token」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

评估方案时要问输入、输出大概多少 token。

2. 上下文窗口

知识点讲解模型一次能看的内容有限，超出部分会丢失或被压缩。

知识点详解

核心定义与工作原理

核心概念「上下文窗口」：上下文窗口是模型一次能看到的信息范围。

放到本步里理解这一点属于「Token、上下文与注意力」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，上下文窗口才能变成可落地的 AI 能力。
什么时候要谨慎：超出窗口的材料会丢失或被压缩，所以长文档必须设计取舍。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“模型一次能看的内容有限，超出部分会丢失或被压缩。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「上下文窗口」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

长文档场景要设计检索、摘要或分段策略。

3. 注意力机制

知识点讲解注意力帮助模型在上下文里关注相关片段。

知识点详解

核心定义与工作原理

核心概念「注意力机制」：注意力机制让模型在上下文里给不同信息分配不同权重。

放到本步里理解这一点属于「Token、上下文与注意力」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，注意力机制才能变成可落地的 AI 能力。
什么时候要谨慎：它能关联远处信息，但不保证永远抓住业务最重要的事实。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“注意力帮助模型在上下文里关注相关片段。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「注意力机制」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

重要信息要放清楚，不要让模型在噪声里猜。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

把一个长需求拆成“必须给模型看”和“可检索补充”的两类信息。

老师怎么判断你学会了

提交作业交一张上下文设计表：输入、约束、示例、输出格式。

合格能解释 token 和上下文为什么影响成本与效果。
优秀能设计减少噪声、突出关键信息的上下文结构。
没通过把所有资料一次性塞给模型。

03 1 天

幻觉、概率生成与能力边界

本步 3 个知识点

学习目标

能判断哪些场景不能只靠大模型直接回答。

先记这一句话

LLM 是按概率生成最可能的文本，不天然保证事实正确。

知识点清单与业务判断 先会用，再理解

1. 概率生成

知识点讲解模型生成的是看起来合理的下一个 token 序列。

知识点详解

核心定义与工作原理

核心概念「概率生成」：大模型是在已有上下文下生成最可能的下一个 token。

放到本步里理解这一点属于「幻觉、概率生成与能力边界」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，概率生成才能变成可落地的 AI 能力。
什么时候要谨慎：所以它擅长语言连续性，不等于天然掌握事实真相。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“模型生成的是看起来合理的下一个 token 序列。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「概率生成」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

对事实、数字、制度类问题要接入来源和校验。

2. 幻觉

知识点讲解模型可能编造不存在的事实、链接、规则或引用。

知识点详解

核心定义与工作原理

核心概念「幻觉」：幻觉是模型生成看似合理但实际不存在或不可靠的信息。

放到本步里理解这一点属于「幻觉、概率生成与能力边界」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，幻觉才能变成可落地的 AI 能力。
什么时候要谨慎：凡是涉及事实、政策、金额、法律、医学、客户承诺，都要加来源校验。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“模型可能编造不存在的事实、链接、规则或引用。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「幻觉」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

高风险输出必须要求引用、检索、人工复核或拒答。

3. 能力边界

知识点讲解模型擅长语言处理、归纳和生成，不擅长没有来源的精确事实。

知识点详解

核心定义与工作原理

核心概念「能力边界」：能力边界是模型稳定能做和不能放心做的范围。

放到本步里理解这一点属于「幻觉、概率生成与能力边界」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，能力边界才能变成可落地的 AI 能力。
什么时候要谨慎：边界不是一次性判断，要随着模型、数据和场景变化持续更新。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“模型擅长语言处理、归纳和生成，不擅长没有来源的精确事实。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「能力边界」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

业务评审要区分“写得好”和“说得对”。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

列出一个场景里哪些输出可以让模型生成，哪些必须有来源校验。

老师怎么判断你学会了

提交作业交一份风险清单：哪些答案需要引用、哪些需要人工复核。

合格能指出幻觉风险和校验方法。
优秀能设计引用、拒答和人工确认机制。
没通过把模型语气自信当成事实正确。

04 1 天

RAG、长上下文、微调怎么选

本步 3 个知识点

学习目标

能在技术评审中说清三种方案的取舍。

先记这一句话

缺知识优先 RAG，缺上下文空间考虑长上下文，缺稳定行为再考虑微调。

知识点清单与业务判断 先会用，再理解

1. RAG

知识点讲解先检索外部知识，再让模型基于资料回答。

知识点详解

核心定义与工作原理

核心概念「RAG」：RAG 是先检索资料，再把资料交给模型回答。

放到本步里理解这一点属于「RAG、长上下文、微调怎么选」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，RAG 才能变成可落地的 AI 能力。
什么时候要谨慎：它适合企业知识问答、制度查询、客服助手等需要来源的场景。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“先检索外部知识，再让模型基于资料回答。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「RAG」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

适合内部文档、制度、知识库和更新频繁内容。

2. 长上下文

知识点讲解把更多材料直接放进模型上下文。

知识点详解

核心定义与工作原理

核心概念「长上下文」：长上下文是把更多材料直接放进模型输入。

放到本步里理解这一点属于「RAG、长上下文、微调怎么选」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，长上下文才能变成可落地的 AI 能力。
什么时候要谨慎：它省去部分检索设计，但成本更高，也可能让关键材料被淹没。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“把更多材料直接放进模型上下文。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「长上下文」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

适合一次性长材料处理，但成本和注意力分散要评估。

3. 微调

知识点讲解用样本调整模型行为风格或任务模式。

知识点详解

核心定义与工作原理

核心概念「微调」：微调用样本改变模型在特定任务上的行为模式。

放到本步里理解这一点属于「RAG、长上下文、微调怎么选」里的基础判断单元。你学习它，不是为了背术语，而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题：第一，这个概念对应的业务对象是什么？第二，当前流程里有没有数据、规则或样本能支撑判断？第三，判断错了会带来什么成本？

什么时候该用：当业务目标清楚、输入材料可获得、输出结果能被检查时，微调才能变成可落地的 AI 能力。
什么时候要谨慎：它适合稳定格式和风格，不适合补充频繁变化的事实知识。
怎么证明学会：你能用自己的业务举 1 个正例和 1 个反例，并说明为什么这个场景适合或不适合使用它。

常见误区与落地产物

容易踩坑只记住“用样本调整模型行为风格或任务模式。”，但没有把它翻译成业务判断标准。真正有用的学习，是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”，标出能直接做、要加资料做、不能放手做的任务。

一句话总结：本模块的核心是把大模型当成概率生成系统来管理，而不是当成永远正确的百科全书。对「微调」来说，最低要求是：能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。

业务判断方法

适合稳定格式和风格，不适合让模型记住经常变化的知识。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

为一个知识问答场景写三种方案的优缺点。

老师怎么判断你学会了

提交作业交一页选择说明：为什么选 RAG、长上下文或微调。

合格能按知识更新频率、成本、稳定性做选择。
优秀能指出不该微调的知识型场景。
没通过把微调当成解决一切效果问题的办法。

深度学习与大模型原理

老师带学方式

本模块学习步骤

神经网络与表示学习

1. 神经网络

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

2. 表示学习

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

3. Embedding

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

Token、上下文与注意力

1. Token

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

2. 上下文窗口

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

3. 注意力机制

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

幻觉、概率生成与能力边界

1. 概率生成

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

2. 幻觉

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

3. 能力边界

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

RAG、长上下文、微调怎么选

1. RAG

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

2. 长上下文

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物

3. 微调

核心定义与工作原理

业务判断方法与适用边界

常见误区与落地产物