LLM工程实战:8周构建8个AI应用
8 周做出 8 个 LLM 工程项目
从第一个 API 应用,到 RAG 知识库、模型评估、微调、部署和 Agent,完整走完大模型应用开发路径。这不是零基础玩工具课,而是一门面向工程师的项目实战课。
RAG
微调
Agent / 部署
课程主线正在持续录制中,已覆盖多个核心项目;已开通学员可持续观看后续更新。主课完成后会继续补充新模型、新工具和实战案例。
2. 微信发送账号和截图
3. 收到课程码后激活
适合已经会一点 Python/API,想从提示词使用者升级到能交付 AI 应用的人。
你不是只学概念,而是一路做出项目
这门课把 LLM 应用开发拆成一条工程路线:先跑通 API 调用和基础应用,再进入多模态、评估、RAG、数据集、微调、部署和 Agent。每个阶段都尽量落到一个能展示、能复盘、能继续改造的项目。
学习 API 调用、网页抓取和结构化输出,把公司网站转成可排版的营销材料。
用 Gradio 和多模态输入,做一个能处理文本、图片和语音的客服 Demo。
从录音生成会议纪要和待办事项,理解音频转文字、摘要和行动项提取。
用 LLM 改写代码并比较性能,学习模型评估、代码生成和结果对比。
构建能回答知识库问题的 AI 助手,覆盖向量数据库、检索、重排和评估。
用前沿模型根据商品描述预测价格,理解数据集、Prompt、批处理和评估指标。
学习 LoRA / QLoRA、训练和评估,对比微调前后的任务效果。
把部署、工具调用和自动化工作流串起来,做一个能自主执行任务并交付结果的 Agent 应用。
这门课适合谁?
- 会一点 Python 基础语法,愿意动手跑代码和调试环境的人。
- 后端、云计算、数据、运维、自动化方向工程师。
- 已经会用 ChatGPT,但想系统掌握 API、RAG、微调和 Agent 的人。
- 想做可交付项目,而不是只听概念的人。
哪些人不太适合?
- 完全不会 Python,且暂时不准备补基础的人。
- 只想看几个工具按钮,不想写代码或调试的人。
- 期待一天掌握所有 AI 技术的人。
- 不愿意动手运行 Notebook、配置环境、分析报错的人。
和 AIF-C01、Bedrock 课程是什么关系?
AIF-C01 更像 AWS AI 云方向的入门认证课,适合先建立 AI/ML、生成式 AI、AWS AI 服务和 Bedrock 的概念地图。Bedrock 课程更聚焦 AWS 生成式 AI 服务的控制台和基础流程。
LLM 工程课的目标不同:它更关注如何用模型 API、RAG、评估、微调、Agent 和部署,把大模型能力做成可以交付的应用。如果你已经有一点 Python/API 基础,想系统进入 AI 应用开发,可以直接从这门课开始。
购买后如何开通课程?
- 先注册/登录 iloveaws.cn,并确认这是你要绑定课程的账号。
- 打开课程开通页的付款码,按 699 元扫码付款,并保存付款截图。
- 微信联系 chenmoemo,发送网站账号、课程名称、付款金额和付款截图。
- 收到课程码后,回到本课程页输入课程代码完成激活。
课程主线仍在持续录制和更新中,已开通学员可继续观看后续新增课时。激活或开通遇到问题时,可按付款后联系信息处理。
课程专属答疑通道
对某个课时有疑问时,请在观看对应课时的下方点击“ASK QUESTION”,写清楚问题并提交。这样问题会和具体课时关联,更方便后续查看和回复。
不知道 AI 路线怎么选?
如果你完全零基础,可以先看轻松入门 AWS;如果目标是 AWS AI 云入门和认证,可以看 AIF-C01;如果目标是项目开发和应用交付,LLM 工程课更适合你。
课程体系
| 第一周-打造你的首个LLM产品:探索顶级模型与Transformers | |||
| 第一天-直接切入:立即开始大语言模型工程 | 00:01:00 | ||
| 第一天-在Windows和Mac上配置Ollama以部署本地大语言模型 | 00:05:00 | ||
| 第一天-释放本地大语言模型的潜力:使用Ollama构建英语学习助手 | 00:05:00 | ||
| 第一天-搭建你的LLM开发环境:工具与最佳实践 | 00:05:00 | ||
| 第一天-Mac配置指南:为LLM项目安装Jupyter Lab和Conda | 00:09:00 | ||
| 第一天-搭建Anaconda环境玩转大语言模型开发:Windows系统安装指南 | 00:09:00 | ||
| 第一天-为LLM开发配置OpenAI API——密钥申请、费用说明与最佳实践指南 | 00:08:00 | ||
| 第一天-创建.env文件安全存储API密钥 | 免费 | 00:07:00 | |
| 第一天-即时满足项目:打造一个AI驱动的网页摘要生成器 | 00:13:00 | ||
| 第一天-用OpenAI的GPT-4和Beautiful Soup实现文本摘要 | 00:15:00 | ||
| 第一天总结-收尾工作:大语言模型工程的关键收获与下一步计划 | 00:05:00 | ||
| 第二天-精通大语言模型工程:AI开发的核心技能与工具 | 00:10:00 | ||
| 第二天-搞懂前沿AI模型:GPT、Claude和开源大语言模型 | 00:09:00 | ||
| 第二天-如何使用Ollama进行本地LLM推理:Python和Jupyter实战教程 | 00:12:00 | ||
| 第二天-实践LLM任务:比较OpenAl和Ollama的文本摘要能力 | 00:01:00 | ||
| 第三天-前沿AI模型大比拼:GPT-4、Claude、Gemini和LLAMA横评 | 00:08:00 | ||
| 第三天-主流大语言模型对比:优势解析与商业场景应用 | 00:03:00 | ||
| 第三天-实测对比GPT-4.5和O4-mini:性能差异全解析 | 00:05:00 | ||
| 第三天-深度解析Claude 4的调校与artifact功能 | 00:06:00 | ||
| 第三天-AI模型对比:用Gemini和deepseek处理脑洞题与分析题的实测 | 00:03:00 | ||
| 第三天-评估grok和Perplexity:模型输出的微妙差异 | 00:04:00 | ||
| 第三天-前沿大语言模型总结及特点 | 00:04:00 | ||
| 第四天-涌现的智能:大语言模型发展简史与核心辩论 | 00:07:00 | ||
| 第四天-探索AI发展历程:从早期模型到Transformer | 00:04:00 | ||
| 第四天-搞懂大模型参数:从GPT-1到万亿参数模型的进化之路 | 00:05:00 | ||
| 第四天-大白话讲明白GPT分词:大语言模型是怎么处理文字的 | 00:09:00 | ||
| 第四天-上下文窗口如何影响AI语言模型:详解token限制 | 00:05:00 | ||
| 第四天-搞懂AI模型成本:接口按量付费VS聊天订阅包月 | 00:04:00 | ||
| 第四天-大模型上下文窗口对比:GPT-4 vs Claude vs Gemini | 00:07:00 | ||
| 第四天-收官总结:第四天核心收获与实践心得 | 00:04:00 | ||
| 第五天-用OpenAI API和Python打造AI营销手册 | 00:05:00 | ||
| 第五天-JupyterLab教程:用网络抓取技术为 AI 驱动的公司制作宣传册 | 00:09:00 | ||
| 第五天-大语言模型的结构化输出:为AI项目优化JSON响应 | 00:12:00 | ||
| 第五天-制作并排版宣传册内容的回复文案 | 00:12:00 | ||
| 第五天-最终调整:优化JupyterLab的Markdown与流式处理 | 00:09:00 | ||
| 第五天-掌握多轮提示技巧:提升AI项目中大语言模型的可靠性 | 00:06:00 | ||
| 第五天-任务:打造你的专属AI导师(基于大语言模型) | 00:05:00 | ||
| 第五天-第一周收官:成果总结与下一步计划 | 00:04:00 | ||
| 第二周-打造多模态聊天机器人:大语言模型、Gradio界面与智能体实战 | |||
| 第一天-玩转多款AI接口:OpenAI、Claude和Gemini大模型工程师速成指南 | 00:06:00 | ||
| 第一天-流式处理 AI 回复:用Python实现大语言模型(LLM)的实时输出 | 00:15:00 | ||
| 第一天-用OpenAI和Claude API制作抬杠式AI对话教程 | 00:10:00 | ||
| 第一天-AI工具篇:开发者实战Transformer与前沿大语言模型 | 00:02:00 | ||
| 第二天-用Gradio搭建AI工具:LLM工程师的快速原型开发 | 00:04:00 | ||
| 第二天-Gradio教程:为OpenAI GPT模型打造交互式AI界面 | 00:13:00 | ||
| 第二天-在Gradio界面中用GPT和Claude实现流式响应 | 00:07:00 | ||
| 第二天-用Gradio搭建多模型AI聊天界面:GPT对战Claude | 00:09:00 | ||
| 第二天-打造高级AI用户界面:从OpenAI接口到Gradio聊天应用开发 | 00:02:00 | ||
| 第三天-打造AI聊天机器人:用Gradio开发客服助手的实战教程 | 00:05:00 | ||
| 第三天-用OpenAI和Gradio搭建对话式AI聊天机器人:手把手教程 | 00:10:00 | ||
| 第三天-用多轮提示和上下文增强让聊天机器人更聪明 | 00:08:00 | ||
| 第三天-玩转AI工具:教你用大语言模型在本地跑代码 | 00:03:00 | ||
| 第四天-搭配AI工具使用LLM:增强大语言模型的能力 | 00:07:00 | ||
| 第四天-打造AI航空助手:用OpenAI GPT-4实现工具集 | 00:07:00 | ||
| 第四天-手把手教你给大模型装外挂:OpenAI函数调用教程 | 00:12:00 | ||
| 第四天-玩转AI工具:用API搭出高级大模型助手 | 00:02:00 | ||
| 第五天-多模态AI助手:图片与声音生成的整合 | 00:05:00 | ||
| 第五天-多模态AI:在JupyterLab中集成DALL-E 3图像生成功能 | 00:06:00 | ||
| 第五天-打造多模态AI助手:整合音频/图像工具 | 00:05:00 | ||
| 第五天-如何打造多模态AI助手:工具与智能体的整合 | 00:04:00 | ||
| 第三周-开源生成式AI:用HuggingFace打造自动化解决方案 | |||
| 第一天-Hugging Face教程:玩转开源AI模型和数据集 | 00:10:00 | ||
| 第一天-探索HuggingFace Hub:AI开发者必备的模型、数据集与空间 | 00:11:00 | ||
| 第一天-谷歌Colab入门:云端Jupyter Notebooks玩转机器学习 | 00:03:00 | ||
| 第一天-在Google Colab中集成Hugging Face:密钥与API配置技巧 | 00:11:00 | ||
| 第一天-玩转Google Colab:用Hugging Face跑开源AI模型 | 00:03:00 | ||
| 第二天-Hugging Face Transformers:用Python和Pipelines搞定AI任务 | 00:05:00 | ||
| 第二天-Hugging Face Pipelines:用Transformers库简化AI任务 | 00:14:00 | ||
| 第二天-玩转HuggingFace Pipelines:机器学习任务的高效AI推理 | 00:02:00 | ||
| 第三天-开源AI中的分词器探索:Llama、Phi-2、Qwen和Starcode | 00:05:00 | ||
| 第三天-AI中的分词技术:使用AutoTokenizer与LLAMA 3.1模型 | 00:12:00 | ||
| 第三天-比较分词器:Llama、PHI-3 和 QWEN2 在开源AI模型中的应用 | 00:11:00 | ||
| 第三天-Hugging Face 分词器:为高级文本生成做准备 | 00:01:00 | ||
| 第四天-Hugging Face 模型类:在开源AI模型上运行推理 | 00:04:00 | ||
| 第四天-Hugging Face Transformers:使用Bits和Bytes加载和量化大语言模型 | 00:15:00 | ||
| 第四天-Hugging Face Transformers:使用开源AI模型生成笑话 | 00:09:00 | ||
| 第四天-掌握Hugging Face Transformers:模型、管道和分词器 | 00:02:00 | ||
| 第五天-结合前沿和开源模型进行音频转文本总结 | 00:04:00 | ||
| 第五天-使用Hugging Face和OpenAI进行AI驱动的会议纪要生成 | 00:14:00 | ||
| 第五天-构建合成测试数据生成器:用于业务的开源AI模型 | 00:05:00 | ||
| 第四周-大模型对决:评估用于代码生成和业务任务的模型 | |||
| 第一天-如何选择合适的LLM:比较开源和闭源模型 | 00:12:00 | ||
| 第一天-优化大语言模型参数和训练数据规模 | 00:06:00 | ||
| 第一天-大模型基准的局限性:过拟合和训练数据泄露 | 00:07:00 | ||
| 第一天-评估大语言模型:下一代基准测试揭晓 | 00:06:00 | ||
| 第一天-HuggingFace开源大模型排行榜:横向评测开源语言模型 | 00:09:00 | ||
| 第一天-大模型排行榜全解析:开源vs闭源模型谁更强 | 00:02:00 | ||
| 第二天-大模型对比:评估语言模型的权威排行榜 | 00:06:00 | ||
| 第二天-玩转AI排行榜:人工评分、HuggingFace那些事儿 | 00:06:00 | ||
| 第二天-人工分析深度剖析:模型智商与成本大比拼 | 00:12:00 | ||
| 第二天-Vellum、SEAL和LiveBench:AI模型必备排行榜 | 00:11:00 | ||
| 第二天-LM Arena:社区蒙眼测试AI模型,用Elo评分打分 | 00:05:00 | ||
| 第二天-商业应用场景:自动化、增强与智能体 | 00:09:00 | ||
| 第三天-如何选大模型来生成代码:把Python转成C++ | 00:09:00 | ||
| 第三天-选模型:GPT-5、Claude、Gemini搞C++代码生成 | 00:11:00 | ||
| 第三天-用GPT-5把Python转成C++:性能狂飙51倍 | 00:13:00 | ||
| 第三天-AI编程对决:GPT-5vsClaudevsGeminivsGrok性能大比拼 | 00:04:00 | ||
| 第四天-代码生成的开源模型:Qwen、DeepSeek和Ollama | 00:10:00 | ||
| 第四天-搭建Gradio界面来测试Python转C++的代码转换模型 | 00:07:00 | ||
| 第四天-qwen3 Coder vs GPT开源模型:模型性能大比拼 | 00:08:00 | ||
| 第五天-模型评估:技术指标与业务成果的碰撞 | 00:11:00 | ||
| 第五天-Python代码转Rust:测试Gemini 2.5 Pro | 00:12:00 | ||
| 第五天-Python移植到Rust:测试GPT、Claude和Qwen模型 | 00:08:00 | ||
| 第五天-开源模型胜出?Rust代码生成速度挑战 | 00:10:00 | ||
| 第五周-精通RAG:用向量嵌入构建高级解决方案 | |||
| 第一天-RAG入门:检索增强生成基础 | 00:10:00 | ||
| 第一天-使用GPT-5-nano构建简易RAG知识助手 | 00:12:00 | ||
| 第一天-搭建简易RAG系统:词典查询与上下文检索 | 00:14:00 | ||
| 第一天-向量嵌入与编码器大语言模型:RAG技术的基石 | 00:11:00 | ||
| 第一天-向量嵌入如何表达含义:从word2vec到编码器 | 00:09:00 | ||
| 第一天-理解RAG与向量数据库的核心概念 | 00:08:00 | ||
| 第二天-RAG中的向量应用:LangChain与向量数据库入门 | 00:09:00 | ||
| 第二天-使用LangChain文本分割器将文档拆分成块 | 00:13:00 | ||
| 第二天-编码器模型vs向量数据库:OpenAI、BERT、Chroma 与 FAISS | 00:12:00 | ||
| 第二天-用Chroma创建向量存储,并用 t-SNE可视化嵌入 | 00:12:00 | ||
| 第二天:三维向量可视化与嵌入模型对比 | 00:13:00 | ||
| 第三天:用LangChain和Chroma构建完整的RAG全链路 | 00:10:00 | ||
| 第三天-用LangChain搭建RAG管线:LLM 与检索器配置 | 00:11:00 | ||
| 第三天-使用LangChain构建RAG系统:检索器与大语言模型集成 | 00:12:00 | ||
| 第三天:使用Python模块和Gradio UI构建生产级RAG系统 | 00:16:00 | ||
| 第三天-带会话历史的RAG:构建Gradio界面并调试文本分块 | 00:15:00 | ||
| 第四天-RAG评估:衡量性能并优化你的处理流程 | 00:09:00 | ||
| 第四天-评估 RAG 系统:检索指标、大语言模型作为评判者与黄金数据集 | 00:14:00 | ||
| 第四天-评估RAG系统:使用Pydantic实现MRR、NDCG与测试数据验证 | 00:13:00 | ||
| 第四天:使用大语言模型作为评估工具——通过结构化输出评判RAG答案质量 | 00:12:00 | ||
| 第四天:在RAG中尝试分块策略与嵌入模型实验 | 00:10:00 | ||
| 第四天-测试OpenAI嵌入模型并评估RAG性能提升效果 | 00:07:00 | ||
| 第五天-高级RAG技巧:预处理、再排序与评估 | 00:06:00 | ||
| 第五天-高级 RAG 技术:分块、编码器和查询重写 | 00:09:00 | ||
| 第五天-高级RAG技术:查询扩展、重排序与GraphRAG | 00:12:00 | ||
| 第五天-不用LangChain构建高级RAG:使用大型语言模型进行语义分块 | 00:15:00 | ||
| 第五天-使用Chroma创建嵌入,用tSNE可视化,以及重新排序 | 00:12:00 | ||
| 第五天-不使用LangChain构建RAG:重新排序和查询重写 | 00:11:00 | ||
| 第五天-使用查询扩展和多进程构建生产级RAG | 00:15:00 | ||
| 第五天-高级RAG评估:使用GPT将MRR指标提升 | 00:12:00 | ||
| 第五天-RAG挑战:打败我的成绩以及打造你的知识员工 | 00:10:00 | ||
| 第六周-从传统机器学习到深度学习,再到微调前沿模型 | |||
| 第一天-训练、数据集和泛化:你的毕业项目开搞啦 | 00:10:00 | ||
| 第一天-微调大语言模型/价格猜猜猜之毕业设计项目介绍 | 00:10:00 | ||
| 第一天-整理数据集:找数据来源和建训练集 | 00:09:00 | ||
| 第一天-用Hugging Face整理亚马逊数据来做价格预测 | 00:10:00 | ||
| 第一天-探索亚马逊数据集分布,去除重复数据 | 00:10:00 | ||
| 第一天-用 NumPy 做加权采样,顺便把数据集传到 Hugging Face | 00:12:00 | ||
| 第二天-选型与应用大模型解决业务问题的五步策略 | 00:09:00 | ||
| 第二天-五步AI流程之用MLOps做产品化 | 00:07:00 | ||
| 第二天-用大语言模型和DeepSeek批处理模式做数据预处理 | 00:09:00 | ||
| 第二天-使用 DeepSeek API 和 JSONL 文件搞批量处理来实现 LLM 工作流 | 00:10:00 | ||
| 第二天-用DeepSeek做批量处理:花不到1美元跑22K个LLM请求 | 00:15:00 | ||
| 第三天-用传统机器学习和XGBoost搭基线模型 | 00:12:00 | ||
| 第三天-使用 Random Pricer 和 Scikit-learn 构建第一个基线模型 | 00:10:00 | ||
| 第三天-使用 Scikit-Learn 构建基线模型和线性回归 | 00:11:00 | ||
| 第三天-用于线性回归 NLP 的 Bag of Words 和 CountVectorizer | 00:08:00 | ||
| 第三天-Random Forest 和 XGBoost:Scikit-Learn 中的集成模型 | 00:11:00 | ||
| 第四天-训练你的第一个神经网络和测试前沿模型 | 00:12:00 | ||
| 第四天-人类基准性能对比 PyTorch 中的机器学习模型 | 00:07:00 | ||
| 第四天-使用PyTorch构建你的第一个神经网络 | 00:12:00 | ||
| 第四天-测试 Qwen 和 DeepSeek 对抗神经网络 | 00:11:00 | ||
| 第四天-测试 Deepseek、GLM的价格预测能力 | 00:11:00 | ||
| 第5天-使用监督微调对OpenAI前沿模型进行微调 | 00:13:00 | ||






