首页
课程
AI
LLM工程实战：8周构建8个AI应用

LLM工程实战：8周构建8个AI应用

面向工程师的 LLM 应用开发实战课

8 周做出 8 个 LLM 工程项目

从第一个 API 应用，到 RAG 知识库、模型评估、微调、部署和 Agent，完整走完大模型应用开发路径。这不是零基础玩工具课，而是一门面向工程师的项目实战课。

8 个项目
RAG
评估 / 微调
Agent / 部署

官网开通价：699 元

课程主线正在持续录制中，已覆盖多个核心项目；已开通学员可持续观看后续更新。主课完成后会继续补充新模型、新工具和实战案例。价格以微店实际展示为准。

立即购买 LLM 工程课已有课程码，去激活查看组合开通

购买后怎么激活

1. 微店下单
2. 短信收码
3. 本页激活

未收到短信时，请先检查短信拦截或垃圾短信，仍未收到可通过微店消息联系店主补发。

适合已经会一点 Python/API，想从提示词使用者升级到能交付 AI 应用的人。

你不是只学概念，而是一路做出项目

课程把 LLM 应用开发拆成一条工程路线：先跑通 API 调用和基础应用，再进入多模态、评估、RAG、数据集、微调、部署和 Agent。每个阶段都落到一个可以运行、可以复盘、可以继续改造的项目。

AI 营销材料生成器

完成什么

把网站内容抓取、整理并生成可排版的营销材料。

训练什么

API 调用、网页抓取、结构化输出和结果校验。

多模态客服助手

完成什么

做一个能处理文本、图片和语音输入的客服 Demo。

训练什么

Gradio 界面、多模态输入、对话流程和用户体验调试。

会议纪要工具

完成什么

从录音生成会议纪要、行动项和可追踪的待办清单。

训练什么

音频转文字、摘要提取、任务拆解和输出格式控制。

AI 代码评测系统

完成什么

让模型生成、改写和比较代码，并记录可解释的评测结果。

训练什么

代码生成、基准测试、结果对比和模型能力边界分析。

企业 RAG 知识专家

完成什么

构建能基于企业资料回答问题的知识库助手。

训练什么

向量数据库、检索、重排、引用检查和 RAG 质量评估。

价格预测基线项目

完成什么

用商品描述建立预测基线，并比较不同模型和提示词效果。

训练什么

数据集处理、批量推理、指标设计和实验记录。

开源模型微调项目

完成什么

完成一次小型微调实验，并对比微调前后的任务效果。

训练什么

LoRA / QLoRA、训练配置、显存约束、评估和复盘。

Agent 毕业项目

完成什么

把工具调用、部署和自动化流程串起来，做一个能执行任务的 Agent 应用。

训练什么

工具选择、调用链路、错误恢复、部署和最终交付。

这门课适合谁？

会一点 Python 基础语法，愿意动手跑代码和调试环境的人。
后端、云计算、数据、运维、自动化方向工程师。
已经会用 ChatGPT，但想系统掌握 API、RAG、微调和 Agent 的人。
想做可交付项目，而不是只听概念的人。

哪些人不太适合？

完全不会 Python，且暂时不准备补基础的人。
只想看几个工具按钮，不想写代码或调试的人。
期待一天掌握所有 AI 技术的人。
不愿意动手运行 Notebook、配置环境、分析报错的人。

和 AIF-C01、Bedrock 课程是什么关系？

AIF-C01 更像 AWS AI 云方向的入门认证课，适合先建立 AI/ML、生成式 AI、AWS AI 服务和 Bedrock 的概念地图。Bedrock 课程更聚焦 AWS 生成式 AI 服务的控制台和基础流程。

LLM 工程课的目标不同：它更关注如何用模型 API、RAG、评估、微调、Agent 和部署，把大模型能力做成可以交付的应用。如果你已经有一点 Python/API 基础，想系统进入 AI 应用开发，可以直接从这门课开始。

购买后如何开通课程？

点击本页“立即购买 LLM 工程课”，在微店完成付款。
付款成功后，系统会将课程代码通过短信发送到下单手机号。
回到本课程页，注册或登录官网账号，输入课程代码完成激活。
激活成功后，点击右侧“开始课程 / 继续课程”进入学习。

如果付款后没有收到短信，请先检查短信拦截、垃圾短信或手机号是否填写正确；仍未收到时，可以通过微店消息联系补发。

课程专属答疑通道

对某个课时有疑问时，请在观看对应课时的下方点击“ASK QUESTION”，写清楚问题并提交。这样问题会和具体课时关联，更方便后续查看和回复。

不知道 AI 路线怎么选？

如果你完全零基础，可以先看轻松入门 AWS；如果目标是 AWS AI 云入门和认证，可以看 AIF-C01；如果目标是项目开发和应用交付，LLM 工程课更适合你。

购买 LLM 工程课先看 AIF-C01 看 Bedrock 课

课程体系

第一周-打造你的首个LLM产品：探索顶级模型与Transformers
	第一天-直接切入:立即开始大语言模型工程		00:01:00
	第一天-在Windows和Mac上配置Ollama以部署本地大语言模型		00:05:00
	第一天-释放本地大语言模型的潜力:使用Ollama构建英语学习助手		00:05:00
	第一天-搭建你的LLM开发环境:工具与最佳实践		00:05:00
	第一天-Mac配置指南:为LLM项目安装Jupyter Lab和Conda		00:09:00
	第一天-搭建Anaconda环境玩转大语言模型开发:Windows系统安装指南		00:09:00
	第一天-为LLM开发配置OpenAI API——密钥申请、费用说明与最佳实践指南		00:08:00
	第一天-创建.env文件安全存储API密钥	免费	00:07:00
	第一天-即时满足项目:打造一个AI驱动的网页摘要生成器		00:13:00
	第一天-用OpenAI的GPT-4和Beautiful Soup实现文本摘要		00:15:00
	第一天总结-收尾工作:大语言模型工程的关键收获与下一步计划		00:05:00
	第二天-精通大语言模型工程:AI开发的核心技能与工具		00:10:00
	第二天-搞懂前沿AI模型:GPT、Claude和开源大语言模型		00:09:00
	第二天-如何使用Ollama进行本地LLM推理:Python和Jupyter实战教程		00:12:00
	第二天-实践LLM任务:比较OpenAl和Ollama的文本摘要能力		00:01:00
	第三天-前沿AI模型大比拼:GPT-4、Claude、Gemini和LLAMA横评		00:08:00
	第三天-主流大语言模型对比:优势解析与商业场景应用		00:03:00
	第三天-实测对比GPT-4.5和O4-mini:性能差异全解析		00:05:00
	第三天-深度解析Claude 4的调校与artifact功能		00:06:00
	第三天-AI模型对比:用Gemini和deepseek处理脑洞题与分析题的实测		00:03:00
	第三天-评估grok和Perplexity:模型输出的微妙差异		00:04:00
	第三天-前沿大语言模型总结及特点		00:04:00
	第四天-涌现的智能:大语言模型发展简史与核心辩论		00:07:00
	第四天-探索AI发展历程:从早期模型到Transformer		00:04:00
	第四天-搞懂大模型参数:从GPT-1到万亿参数模型的进化之路		00:05:00
	第四天-大白话讲明白GPT分词:大语言模型是怎么处理文字的		00:09:00
	第四天-上下文窗口如何影响AI语言模型:详解token限制		00:05:00
	第四天-搞懂AI模型成本:接口按量付费VS聊天订阅包月		00:04:00
	第四天-大模型上下文窗口对比:GPT-4 vs Claude vs Gemini		00:07:00
	第四天-收官总结:第四天核心收获与实践心得		00:04:00
	第五天-用OpenAI API和Python打造AI营销手册		00:05:00
	第五天-JupyterLab教程:用网络抓取技术为 AI 驱动的公司制作宣传册		00:09:00
	第五天-大语言模型的结构化输出:为AI项目优化JSON响应		00:12:00
	第五天-制作并排版宣传册内容的回复文案		00:12:00
	第五天-最终调整:优化JupyterLab的Markdown与流式处理		00:09:00
	第五天-掌握多轮提示技巧:提升AI项目中大语言模型的可靠性		00:06:00
	第五天-任务:打造你的专属AI导师(基于大语言模型)		00:05:00
	第五天-第一周收官:成果总结与下一步计划		00:04:00
第二周-打造多模态聊天机器人：大语言模型、Gradio界面与智能体实战
	第一天-玩转多款AI接口:OpenAI、Claude和Gemini大模型工程师速成指南		00:06:00
	第一天-流式处理 AI 回复:用Python实现大语言模型(LLM)的实时输出		00:15:00
	第一天-用OpenAI和Claude API制作抬杠式AI对话教程		00:10:00
	第一天-AI工具篇:开发者实战Transformer与前沿大语言模型		00:02:00
	第二天-用Gradio搭建AI工具:LLM工程师的快速原型开发		00:04:00
	第二天-Gradio教程:为OpenAI GPT模型打造交互式AI界面		00:13:00
	第二天-在Gradio界面中用GPT和Claude实现流式响应		00:07:00
	第二天-用Gradio搭建多模型AI聊天界面:GPT对战Claude		00:09:00
	第二天-打造高级AI用户界面:从OpenAI接口到Gradio聊天应用开发		00:02:00
	第三天-打造AI聊天机器人:用Gradio开发客服助手的实战教程		00:05:00
	第三天-用OpenAI和Gradio搭建对话式AI聊天机器人:手把手教程		00:10:00
	第三天-用多轮提示和上下文增强让聊天机器人更聪明		00:08:00
	第三天-玩转AI工具:教你用大语言模型在本地跑代码		00:03:00
	第四天-搭配AI工具使用LLM:增强大语言模型的能力		00:07:00
	第四天-打造AI航空助手:用OpenAI GPT-4实现工具集		00:07:00
	第四天-手把手教你给大模型装外挂:OpenAI函数调用教程		00:12:00
	第四天-玩转AI工具:用API搭出高级大模型助手		00:02:00
	第五天-多模态AI助手:图片与声音生成的整合		00:05:00
	第五天-多模态AI:在JupyterLab中集成DALL-E 3图像生成功能		00:06:00
	第五天-打造多模态AI助手:整合音频/图像工具		00:05:00
	第五天-如何打造多模态AI助手:工具与智能体的整合		00:04:00
第三周-开源生成式AI：用HuggingFace打造自动化解决方案
	第一天-Hugging Face教程:玩转开源AI模型和数据集		00:10:00
	第一天-探索HuggingFace Hub:AI开发者必备的模型、数据集与空间		00:11:00
	第一天-谷歌Colab入门:云端Jupyter Notebooks玩转机器学习		00:03:00
	第一天-在Google Colab中集成Hugging Face:密钥与API配置技巧		00:11:00
	第一天-玩转Google Colab:用Hugging Face跑开源AI模型		00:03:00
	第二天-Hugging Face Transformers:用Python和Pipelines搞定AI任务		00:05:00
	第二天-Hugging Face Pipelines:用Transformers库简化AI任务		00:14:00
	第二天-玩转HuggingFace Pipelines:机器学习任务的高效AI推理		00:02:00
	第三天-开源AI中的分词器探索:Llama、Phi-2、Qwen和Starcode		00:05:00
	第三天-AI中的分词技术:使用AutoTokenizer与LLAMA 3.1模型		00:12:00
	第三天-比较分词器:Llama、PHI-3 和 QWEN2 在开源AI模型中的应用		00:11:00
	第三天-Hugging Face 分词器:为高级文本生成做准备		00:01:00
	第四天-Hugging Face 模型类:在开源AI模型上运行推理		00:04:00
	第四天-Hugging Face Transformers:使用Bits和Bytes加载和量化大语言模型		00:15:00
	第四天-Hugging Face Transformers:使用开源AI模型生成笑话		00:09:00
	第四天-掌握Hugging Face Transformers:模型、管道和分词器		00:02:00
	第五天-结合前沿和开源模型进行音频转文本总结		00:04:00
	第五天-使用Hugging Face和OpenAI进行AI驱动的会议纪要生成		00:14:00
	第五天-构建合成测试数据生成器:用于业务的开源AI模型		00:05:00
第四周-大模型对决：评估用于代码生成和业务任务的模型
	第一天-如何选择合适的LLM:比较开源和闭源模型		00:12:00
	第一天-优化大语言模型参数和训练数据规模		00:06:00
	第一天-大模型基准的局限性:过拟合和训练数据泄露		00:07:00
	第一天-评估大语言模型:下一代基准测试揭晓		00:06:00
	第一天-HuggingFace开源大模型排行榜:横向评测开源语言模型		00:09:00
	第一天-大模型排行榜全解析:开源vs闭源模型谁更强		00:02:00
	第二天-大模型对比:评估语言模型的权威排行榜		00:06:00
	第二天-玩转AI排行榜:人工评分、HuggingFace那些事儿		00:06:00
	第二天-人工分析深度剖析:模型智商与成本大比拼		00:12:00
	第二天-Vellum、SEAL和LiveBench:AI模型必备排行榜		00:11:00
	第二天-LM Arena:社区蒙眼测试AI模型,用Elo评分打分		00:05:00
	第二天-商业应用场景:自动化、增强与智能体		00:09:00
	第三天-如何选大模型来生成代码:把Python转成C++		00:09:00
	第三天-选模型:GPT-5、Claude、Gemini搞C++代码生成		00:11:00
	第三天-用GPT-5把Python转成C++:性能狂飙51倍		00:13:00
	第三天-AI编程对决:GPT-5vsClaudevsGeminivsGrok性能大比拼		00:04:00
	第四天-代码生成的开源模型:Qwen、DeepSeek和Ollama		00:10:00
	第四天-搭建Gradio界面来测试Python转C++的代码转换模型		00:07:00
	第四天-qwen3 Coder vs GPT开源模型:模型性能大比拼		00:08:00
	第五天-模型评估:技术指标与业务成果的碰撞		00:11:00
	第五天-Python代码转Rust:测试Gemini 2.5 Pro		00:12:00
	第五天-Python移植到Rust:测试GPT、Claude和Qwen模型		00:08:00
	第五天-开源模型胜出？Rust代码生成速度挑战		00:10:00
第五周-精通RAG：用向量嵌入构建高级解决方案
	第一天-RAG入门:检索增强生成基础		00:10:00
	第一天-使用GPT-5-nano构建简易RAG知识助手		00:12:00
	第一天-搭建简易RAG系统:词典查询与上下文检索		00:14:00
	第一天-向量嵌入与编码器大语言模型:RAG技术的基石		00:11:00
	第一天-向量嵌入如何表达含义:从word2vec到编码器		00:09:00
	第一天-理解RAG与向量数据库的核心概念		00:08:00
	第二天-RAG中的向量应用:LangChain与向量数据库入门		00:09:00
	第二天-使用LangChain文本分割器将文档拆分成块		00:13:00
	第二天-编码器模型vs向量数据库:OpenAI、BERT、Chroma 与 FAISS		00:12:00
	第二天-用Chroma创建向量存储,并用 t-SNE可视化嵌入		00:12:00
	第二天:三维向量可视化与嵌入模型对比		00:13:00
	第三天:用LangChain和Chroma构建完整的RAG全链路		00:10:00
	第三天-用LangChain搭建RAG管线:LLM 与检索器配置		00:11:00
	第三天-使用LangChain构建RAG系统:检索器与大语言模型集成		00:12:00
	第三天:使用Python模块和Gradio UI构建生产级RAG系统		00:16:00
	第三天-带会话历史的RAG:构建Gradio界面并调试文本分块		00:15:00
	第四天-RAG评估:衡量性能并优化你的处理流程		00:09:00
	第四天-评估 RAG 系统:检索指标、大语言模型作为评判者与黄金数据集		00:14:00
	第四天-评估RAG系统:使用Pydantic实现MRR、NDCG与测试数据验证		00:13:00
	第四天:使用大语言模型作为评估工具——通过结构化输出评判RAG答案质量		00:12:00
	第四天:在RAG中尝试分块策略与嵌入模型实验		00:10:00
	第四天-测试OpenAI嵌入模型并评估RAG性能提升效果		00:07:00
	第五天-高级RAG技巧:预处理、再排序与评估		00:06:00
	第五天-高级 RAG 技术:分块、编码器和查询重写		00:09:00
	第五天-高级RAG技术:查询扩展、重排序与GraphRAG		00:12:00
	第五天-不用LangChain构建高级RAG：使用大型语言模型进行语义分块		00:15:00
	第五天-使用Chroma创建嵌入，用tSNE可视化，以及重新排序		00:12:00
	第五天-不使用LangChain构建RAG：重新排序和查询重写		00:11:00
	第五天-使用查询扩展和多进程构建生产级RAG		00:15:00
	第五天-高级RAG评估:使用GPT将MRR指标提升		00:12:00
	第五天-RAG挑战:打败我的成绩以及打造你的知识员工		00:10:00
第六周-从传统机器学习到深度学习，再到微调前沿模型
	第一天-训练、数据集和泛化：你的毕业项目开搞啦		00:10:00
	第一天-微调大语言模型/价格猜猜猜之毕业设计项目介绍		00:10:00
	第一天-整理数据集：找数据来源和建训练集		00:09:00
	第一天-用Hugging Face整理亚马逊数据来做价格预测		00:10:00
	第一天-探索亚马逊数据集分布,去除重复数据		00:10:00
	第一天-用 NumPy 做加权采样,顺便把数据集传到 Hugging Face		00:12:00
	第二天-选型与应用大模型解决业务问题的五步策略		00:09:00
	第二天-五步AI流程之用MLOps做产品化		00:07:00
	第二天-用大语言模型和DeepSeek批处理模式做数据预处理		00:09:00
	第二天-使用 DeepSeek API 和 JSONL 文件搞批量处理来实现 LLM 工作流		00:10:00
	第二天-用DeepSeek做批量处理:花不到1美元跑22K个LLM请求		00:15:00
	第三天-用传统机器学习和XGBoost搭基线模型		00:12:00
	第三天-使用 Random Pricer 和 Scikit-learn 构建第一个基线模型		00:10:00
	第三天-使用 Scikit-Learn 构建基线模型和线性回归		00:11:00
	第三天-用于线性回归 NLP 的 Bag of Words 和 CountVectorizer		00:08:00
	第三天-Random Forest 和 XGBoost：Scikit-Learn 中的集成模型		00:11:00
	第四天-训练你的第一个神经网络和测试前沿模型		00:12:00
	第四天-人类基准性能对比 PyTorch 中的机器学习模型		00:07:00
	第四天-使用PyTorch构建你的第一个神经网络		00:12:00
	第四天-测试 Qwen 和 DeepSeek 对抗神经网络		00:11:00
	第四天-测试 Deepseek、GLM的价格预测能力		00:11:00
	第五天-使用监督微调对OpenAI前沿模型进行微调		00:13:00
	第五天-使用百炼的API微调Qwen构建自定义模型		00:08:00
	第五天-微调Qwen模型:运行任务和监控训练		00:07:00
	第五天-微调结果:当Qwen变差而非变好		00:13:00
	第五天-前沿模型微调失败时/构建深度神经网络		00:11:00
	第五天-深度神经网络的救赎！2.89亿参数 vs 前沿模型		00:10:00
第七周-微调开源模型与前沿模型竞争
	第一天-用于微调开源模型的 QLoRA 介绍		00:09:00
	第一天-LoRA：使用低秩适配器训练 LLaMA 3.2		00:08:00
	第一天-LoRA 超参数与 QLoRA 量化详解		00:13:00
	第一天-配置 Google Colab 并探索 LLaMA 3.2 模型架构		00:17:00
	第一天-用QLoRA加载8位和4位量化模型		00:13:00
	第一天-LoRA参数计算与Hugging Face上的模型大小		00:10:00
	第二天-为微调准备数据集并处理Token限制		00:12:00
	第二天-微调数据准备：价格四舍五入与 Token 长度优化		00:13:00
	第二天-准备 Hugging Face 数据集并测试基础 LLaMA 3.2 模型		00:14:00
	第二天-基础模型与聊天模型：理解 LLaMA 微调		00:13:00
	第三天-微调超参数：QLoRA 设置与训练配置		00:12:00
	第三天-LoRA 的学习率、优化器和训练超参数		00:10:00
	第三天-设置训练：超参数、QLoRA 配置与 Weights & Biases		00:16:00
	第三天-设置 Weights & Biases 和 Hugging Face SFT Trainer		00:11:00
	第三天-使用 TRL 运行微调，并在 Weights & Biases 中监控训练		00:10:00