免费开源 · 企业级 · 生产部署

LLM 工程与生产部署

RAG 系统构建、模型微调、大规模 LLM 工程、生产级 Agent 部署。面向企业级 AI 应用的完整技术栈,从开发到上线全覆盖。

6
周学习
18
课时
高级
难度级别
5+
生产项目

学习路径

从 LLM 工程基础到生产部署,每周一个核心模块

基础阶(第 1-2 周)

Transformer 架构、RAG 系统构建。目标:"理解底层原理"

🔧

进阶阶(第 3-4 周)

模型微调、生产级系统、性能优化。目标:"能独立构建"

🏗️

实战阶(第 5-6 周)

生产 Agent、MCP 协议、企业级项目。目标:"能部署上线"

课程大纲

6 周 18 课时,每课都有理论和实战

Week 1 3 课时 · LLM 工程基础

Transformer、Tokenizer、Prompt 工程进阶

1
Transformer 架构深度解析60min

理解 Attention、Self-Attention、Multi-Head Attention 的本质

2
Tokenizer 与 Embedding 工程45min

Token 化原理、上下文窗口管理、Embedding 模型选型

3
高级 Prompt Engineering45min

Few-shot、Chain-of-Thought、ReAct、ToT 等高级技巧

Week 2 3 课时 · RAG 系统构建

检索增强生成、向量数据库、混合检索

4
RAG 架构设计与实践60min

文档分块、Embedding、索引构建、相似度检索

5
向量数据库选型与优化45min

Pinecone、Weaviate、Milvus、Chroma 对比

6
混合检索与重排序45min

BM25 + 向量混合检索、Cross-Encoder 重排序策略

Week 3 3 课时 · 模型微调与优化

LoRA、QLoRA、评估与对齐

7
指令微调(Instruction Tuning)60min

构建训练数据集、微调策略、损失函数

8
LoRA 与 QLoRA 实战60min

低成本微调方法,在消费级 GPU 上微调大模型

9
模型评估与对齐45min

BLEU、ROUGE、LLM-as-Judge、RLHF 基础

Week 4 3 课时 · 生产级 LLM 系统

缓存、流式输出、监控、A/B 测试

10
LLM 应用架构设计45min

服务化、微服务、事件驱动架构

11
性能优化:缓存与流式45min

Semantic Cache、Streaming 输出、延迟优化

12
监控、日志与评估45min

TruLens、LangSmith、A/B 测试框架

Week 5 3 课时 · Agent 在生产环境

多 Agent 编排、工具安全、错误处理

13
生产级 Agent 架构45min

Agent 状态管理、超时重试、降级策略

14
工具调用的安全与限制45min

沙箱执行、权限控制、输入输出验证

15
多 Agent 编排系统60min

Supervisor、Hierarchical、Swarm 等编排模式

Week 6 3 课时 · MCP 生态与部署实战

Model Context Protocol、部署、综合项目

16
MCP 协议深度解析60min

MCP 架构、Server/Client 模式、工具注册

17
部署到生产环境60min

Docker、Kubernetes、CI/CD Pipeline、成本优化

18
综合项目:企业级 AI 应用90min

从需求分析到上线部署,完成一个完整的企业级项目

课件下载

全部课件为 Markdown 格式,可用 Typora、Obsidian 或任意 Markdown 编辑器打开

或一次性下载全部课件(约 520KB)

下载全部课件

欢迎关注「一豪同学」

全部课程免费开源,更多 AI 实战教程和更新请关注微信公众号「一豪同学」

返回课程列表