AI 晋升学习模块

Module 02

深度学习与大模型原理

不用成为算法工程师,但要懂 LLM 的能力边界和工程取舍。

老师带学方式

你不需要一次全懂

先记一句话,再做 10 分钟练习,最后交一个小作业。老师只看你能不能把知识用到真实业务判断里。

每一步按 4 个动作学
  1. 先背一句话,建立判断框架。
  2. 看知识点,但只抓业务判断方法。
  3. 做 10 分钟练习,套到你的场景。
  4. 按“合格 / 优秀 / 没通过”检查作业。

Lessons

本模块学习步骤

每张卡都是一个小模块,建议一天只学 1-2 张,学完必须交作业,否则就算只看了一遍。

01 0.5 天

神经网络与表示学习

本步 3 个知识点
学习目标

理解模型不是背知识库,而是在高维表示里学习模式。

先记这一句话

神经网络把输入变成一层层表示,越后面的表示越接近任务目标。

知识点清单与业务判断 先会用,再理解

1. 神经网络

知识点讲解由多层参数组成,通过训练调整参数来减少错误。

知识点详解
核心定义与工作原理

核心概念「神经网络」:由多层参数组成,通过训练调整参数来减少错误。

放到本步里理解这一点属于「神经网络与表示学习」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,神经网络 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:边界要看模型是否有足够上下文、答案是否需要事实来源、生成错误是否会造成业务损失。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“由多层参数组成,通过训练调整参数来减少错误。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「神经网络」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

不要把模型理解成数据库,它更像模式匹配器。

2. 表示学习

知识点讲解模型把文本、图片、行为转成可计算表示。

知识点详解
核心定义与工作原理

核心概念「表示学习」:模型把文本、图片、行为转成可计算表示。

放到本步里理解这一点属于「神经网络与表示学习」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,表示学习 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:边界要看模型是否有足够上下文、答案是否需要事实来源、生成错误是否会造成业务损失。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“模型把文本、图片、行为转成可计算表示。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「表示学习」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

判断场景时问:输入信息是否足够表达业务差异。

3. Embedding

知识点讲解Embedding 是语义或对象的向量表示,可用于相似度和检索。

知识点详解
核心定义与工作原理

核心概念「Embedding」:Embedding 是语义或对象的向量表示,可用于相似度和检索。

放到本步里理解这一点属于「神经网络与表示学习」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,Embedding 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:边界要看模型是否有足够上下文、答案是否需要事实来源、生成错误是否会造成业务损失。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“Embedding 是语义或对象的向量表示,可用于相似度和检索。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「Embedding」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

适合语义搜索、推荐、去重和聚类,不适合替代事实来源。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

找 3 个业务对象,说明它们可以如何被表示成特征或 embedding。

老师怎么判断你学会了

提交作业交一段解释:神经网络、表示学习和 embedding 分别解决什么。

  • 合格能用非技术语言解释“表示”。
  • 优秀能说清 embedding 适合相似度,不等于事实正确。
  • 没通过把 embedding 说成万能记忆库。
02 1 天

Token、上下文与注意力

本步 3 个知识点
学习目标

理解 LLM 为什么受长度限制、为什么提示词会影响输出。

先记这一句话

LLM 看到的是 token 序列,回答质量很大程度取决于上下文质量。

知识点清单与业务判断 先会用,再理解

1. Token

知识点讲解模型把文本拆成 token 处理,成本和长度通常按 token 计算。

知识点详解
核心定义与工作原理

核心概念「Token」:Token 是模型处理文本的基本单位,可能是字、词或词片段。

放到本步里理解这一点属于「Token、上下文与注意力」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,Token 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:成本、速度、上下文长度都和 token 数有关。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“模型把文本拆成 token 处理,成本和长度通常按 token 计算。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「Token」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

评估方案时要问输入、输出大概多少 token。

2. 上下文窗口

知识点讲解模型一次能看的内容有限,超出部分会丢失或被压缩。

知识点详解
核心定义与工作原理

核心概念「上下文窗口」:上下文窗口是模型一次能看到的信息范围。

放到本步里理解这一点属于「Token、上下文与注意力」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,上下文窗口 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:超出窗口的材料会丢失或被压缩,所以长文档必须设计取舍。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“模型一次能看的内容有限,超出部分会丢失或被压缩。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「上下文窗口」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

长文档场景要设计检索、摘要或分段策略。

3. 注意力机制

知识点讲解注意力帮助模型在上下文里关注相关片段。

知识点详解
核心定义与工作原理

核心概念「注意力机制」:注意力机制让模型在上下文里给不同信息分配不同权重。

放到本步里理解这一点属于「Token、上下文与注意力」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,注意力机制 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:它能关联远处信息,但不保证永远抓住业务最重要的事实。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“注意力帮助模型在上下文里关注相关片段。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「注意力机制」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

重要信息要放清楚,不要让模型在噪声里猜。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

把一个长需求拆成“必须给模型看”和“可检索补充”的两类信息。

老师怎么判断你学会了

提交作业交一张上下文设计表:输入、约束、示例、输出格式。

  • 合格能解释 token 和上下文为什么影响成本与效果。
  • 优秀能设计减少噪声、突出关键信息的上下文结构。
  • 没通过把所有资料一次性塞给模型。
03 1 天

幻觉、概率生成与能力边界

本步 3 个知识点
学习目标

能判断哪些场景不能只靠大模型直接回答。

先记这一句话

LLM 是按概率生成最可能的文本,不天然保证事实正确。

知识点清单与业务判断 先会用,再理解

1. 概率生成

知识点讲解模型生成的是看起来合理的下一个 token 序列。

知识点详解
核心定义与工作原理

核心概念「概率生成」:大模型是在已有上下文下生成最可能的下一个 token。

放到本步里理解这一点属于「幻觉、概率生成与能力边界」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,概率生成 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:所以它擅长语言连续性,不等于天然掌握事实真相。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“模型生成的是看起来合理的下一个 token 序列。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「概率生成」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

对事实、数字、制度类问题要接入来源和校验。

2. 幻觉

知识点讲解模型可能编造不存在的事实、链接、规则或引用。

知识点详解
核心定义与工作原理

核心概念「幻觉」:幻觉是模型生成看似合理但实际不存在或不可靠的信息。

放到本步里理解这一点属于「幻觉、概率生成与能力边界」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,幻觉 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:凡是涉及事实、政策、金额、法律、医学、客户承诺,都要加来源校验。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“模型可能编造不存在的事实、链接、规则或引用。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「幻觉」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

高风险输出必须要求引用、检索、人工复核或拒答。

3. 能力边界

知识点讲解模型擅长语言处理、归纳和生成,不擅长没有来源的精确事实。

知识点详解
核心定义与工作原理

核心概念「能力边界」:能力边界是模型稳定能做和不能放心做的范围。

放到本步里理解这一点属于「幻觉、概率生成与能力边界」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,能力边界 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:边界不是一次性判断,要随着模型、数据和场景变化持续更新。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“模型擅长语言处理、归纳和生成,不擅长没有来源的精确事实。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「能力边界」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

业务评审要区分“写得好”和“说得对”。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

列出一个场景里哪些输出可以让模型生成,哪些必须有来源校验。

老师怎么判断你学会了

提交作业交一份风险清单:哪些答案需要引用、哪些需要人工复核。

  • 合格能指出幻觉风险和校验方法。
  • 优秀能设计引用、拒答和人工确认机制。
  • 没通过把模型语气自信当成事实正确。
04 1 天

RAG、长上下文、微调怎么选

本步 3 个知识点
学习目标

能在技术评审中说清三种方案的取舍。

先记这一句话

缺知识优先 RAG,缺上下文空间考虑长上下文,缺稳定行为再考虑微调。

知识点清单与业务判断 先会用,再理解

1. RAG

知识点讲解先检索外部知识,再让模型基于资料回答。

知识点详解
核心定义与工作原理

核心概念「RAG」:RAG 是先检索资料,再把资料交给模型回答。

放到本步里理解这一点属于「RAG、长上下文、微调怎么选」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,RAG 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:它适合企业知识问答、制度查询、客服助手等需要来源的场景。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“先检索外部知识,再让模型基于资料回答。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「RAG」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

适合内部文档、制度、知识库和更新频繁内容。

2. 长上下文

知识点讲解把更多材料直接放进模型上下文。

知识点详解
核心定义与工作原理

核心概念「长上下文」:长上下文是把更多材料直接放进模型输入。

放到本步里理解这一点属于「RAG、长上下文、微调怎么选」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,长上下文 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:它省去部分检索设计,但成本更高,也可能让关键材料被淹没。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“把更多材料直接放进模型上下文。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「长上下文」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

适合一次性长材料处理,但成本和注意力分散要评估。

3. 微调

知识点讲解用样本调整模型行为风格或任务模式。

知识点详解
核心定义与工作原理

核心概念「微调」:微调用样本改变模型在特定任务上的行为模式。

放到本步里理解这一点属于「RAG、长上下文、微调怎么选」里的基础判断单元。你学习它,不是为了背术语,而是为了在真实项目里知道该问什么、看什么证据、用什么方式验证。

业务判断方法与适用边界

先问三个问题:第一,这个概念对应的业务对象是什么?第二,当前流程里有没有数据、规则或样本能支撑判断?第三,判断错了会带来什么成本?

  • 什么时候该用:当业务目标清楚、输入材料可获得、输出结果能被检查时,微调 才能变成可落地的 AI 能力。
  • 什么时候要谨慎:它适合稳定格式和风格,不适合补充频繁变化的事实知识。
  • 怎么证明学会:你能用自己的业务举 1 个正例和 1 个反例,并说明为什么这个场景适合或不适合使用它。
常见误区与落地产物

容易踩坑只记住“用样本调整模型行为风格或任务模式。”,但没有把它翻译成业务判断标准。真正有用的学习,是能把概念落到数据、流程、指标、风险和责任人上。

学完要产出一张“大模型能力边界说明”,标出能直接做、要加资料做、不能放手做的任务。

一句话总结:本模块的核心是把大模型当成概率生成系统来管理,而不是当成永远正确的百科全书。 对「微调」来说,最低要求是:能讲清它解决什么问题、依赖什么条件、不能覆盖什么风险。
业务判断方法

适合稳定格式和风格,不适合让模型记住经常变化的知识。

学习产出

一份《RAG、长上下文、微调选择说明》

10 分钟练习

为一个知识问答场景写三种方案的优缺点。

老师怎么判断你学会了

提交作业交一页选择说明:为什么选 RAG、长上下文或微调。

  • 合格能按知识更新频率、成本、稳定性做选择。
  • 优秀能指出不该微调的知识型场景。
  • 没通过把微调当成解决一切效果问题的办法。
系统资料

这些资料用于深挖原理。先完成本页作业,再去看资料,效率会高很多。