目录

📚 大语言模型(LLM)学习路径和资料汇总

💬 荣誉归属于原作者

  • 本文内容:整理/重构自 大语言模型(LLM)学习路径和资料汇总
  • 原作者:ninehills
  • 授权方式:作者邮件回复同意转载(授权记录见下图)
  • 原文最后更新:2024-10-18
  • 感谢 ninehills 对开源社区的卓越贡献。

作者邮件授权记录


这是一份经过精心筛选的 LLM 学习资源清单,按难度分为入门、应用、深入三个层级。原作者标注了「必看」的推荐优先级,我们原样保留。

适合有一定技术背景、想系统了解大模型的读者。纯零基础建议先从 学习路线 的幼儿园阶段开始。


🌱 入门篇

了解大语言模型的基础知识和常见术语,学会使用编程语言访问大模型接口。


🔧 应用篇

本地搭建开源模型、应用开发框架、Prompt 工程、RAG、Agent 等。


🧠 深入篇

大模型技术原理、训练微调、数据工程、推理优化等。

技术基础

技术原理

体系化课程(斯坦福):

  • CS25:通识整体介绍
  • CS224N:NLP + 深度神经网络 + Transformer
  • CS336:大语言模型从头实现(难度很高)

训练微调

数据工程

推理优化

应用前沿


⚠️ 部分链接(YouTube、HuggingFace、GitHub、OpenAI)在中国大陆需要科学上网才能访问。 文中已标注 B 站中文字幕的替代链接,请优先使用。