目录
🎓 专栏:李沐(Mu Li)— 技术世界的翻译官
ℹ️ 学习看板
- 前置要求:基础英语
- 预计成本:免费 · ⏱ 按需 · 🧠 中
💬 荣誉归属于原作者
- 本文内容:AI 磨刀匠对 李沐(Mu Li) 公开内容的整理与推荐
- 所有推荐内容的版权归原作者所有
- 感谢其对 AI 知识传播的贡献。
👤 他是谁
李沐(Mu Li),前亚马逊首席科学家,《动手学深度学习》作者(被全球 70+ 国家、500+ 所大学用于教学),MXNet 框架核心开发者。2023 年离开亚马逊创办 Boson AI,投身大模型创业。
他的独特价值:能把最晦涩的论文讲到非工程师都听得懂。 B 站”论文精读”系列是中文世界质量最高的 AI 论文解读。
🎬 精选内容
论文精读系列(B 站)
💡 如果你想理解大模型背后的关键论文,这是中文世界最好的选择。
必看(大模型核心论文)
| 论文 | 链接 | 为什么重要 |
|---|---|---|
| Transformer(Attention Is All You Need) | B 站 | 一切大模型的基石,理解 Transformer 就理解了大模型的底层架构 |
| BERT | B 站 | 预训练模型的里程碑,开创了”先预训练再微调”的范式 |
| GPT / GPT-2 / GPT-3 | B 站 | 三代 GPT 的演进逻辑,一个视频讲清楚 |
| GPT-4 | B 站 | GPT-4 技术报告解读 |
| ViT(Vision Transformer) | B 站 | Transformer 从文本扩展到图像 |
进阶
| 论文 | 链接 | 领域 |
|---|---|---|
| ViLT | B 站 | 多模态(文本+图像) |
| Pathways | B 站 | Google 的下一代 AI 架构 |
ℹ️ 完整列表 李沐的论文精读系列持续更新中,完整列表见 GitHub:mli/paper-reading
动手学深度学习
- 教材:zh.d2l.ai(免费在线阅读)
- 配套视频:B 站课程
- GitHub:d2l-ai/d2l-zh(被 500+ 所大学采用)
- 适合谁:高中-大学阶段的学习者,需要有一定编程基础
⭐ 为什么关注他
- 论文解读无出其右:中文世界最好的 AI 论文精读,没有之一
- 学术+工业双重视角:亚马逊首席科学家 + 创业者,既懂理论又懂落地
- 教材级输出:《动手学深度学习》是全球标准教材级别的作品
- 说人话:虽然内容偏技术,但他的讲解方式让非科班出身的人也能跟上
🔗 在哪里关注他
| 平台 | 链接 | 特点 |
|---|---|---|
| B 站 | mu-li | 论文精读、课程视频 |
| YouTube | Mu Li | 同步发布 |
| GitHub | mli | 论文精读列表、开源项目 |
⚠️ 注意 李沐的论文精读系列偏技术向,适合初中阶段以上的学习者。如果你是零基础,建议先看 Karpathy 的入门视频建立基础认知,再来看李沐的论文解读。
🚀 下一步
想听更硬核的一线深度对话?继续阅读 专栏-WhynotTV——CMU 博士生与 AI 顶级学者的 2-4 小时深度访谈。