GitHub - nageoffer/awesome-ai-handbook: 🤖 AI 工程师的成长手册：从基础知识到 RAG、Agent 实战，涵盖学习路径与高频面试题。

程序员转型 AI 工程师的全栈知识手册

💡 为什么做这个项目

大模型时代已经到来，越来越多的程序员希望转型 AI 方向，但面临几个痛点：

知识碎片化：不知道从哪学起，找不到系统的学习路径。
理论和实战脱节：看了很多论文但不会落地，缺少工程化实践。
面试无从准备：不知道 AI 岗位考什么，缺少体系化的备战资料。

这个仓库就是为了解决这些问题 —— 一份持续更新的 AI 工程师成长手册，系统梳理 AI 基础、LLM、RAG、Agent 等核心知识，助你从入门到转型 AI 工程师。

🧭 入门导航

刚接触 AI？从这里开始，快速建立全局认知。

主题	说明	状态
程序员如何成长为 AI 工程师	AI 工程师定位、学习路线与技术栈全景	✅
AI 学习资料推荐	精选书单、课程、博客与开源项目	🔲
AI 常见名词速查表	RAG、Agent、MCP、Skills、CLI 等核心术语一网打尽	🔲

📖 体系教学

按方向系统学习，每个方向从基础到进阶完整覆盖。

RAG 系列 · 从零构建检索增强生成系统

章节	关键内容	状态
第一部分：大模型基础
01、大模型到底是什么？核心概念讲透	Token、参数量、温度等核心术语全解析	✅
02、手把手调用大模型 API 全流程	Chat Completions 协议，流式与非流式实现	✅
03、好 Prompt vs 烂 Prompt 写法对比	对比差异写法，让模型精准基于内容作答	✅
第二部分：RAG 核心链路
04、一张图看懂 RAG 全链路架构	全链路架构总览与企业实战项目背景	✅
05、文档解析没你想的那么简单	Apache Tika 解析 PDF、扫描件等多格式	✅
06、Chunk 分块策略决定检索质量	上下文窗口限制下的分块与精度优化	✅
07、别忽视元数据：答案要能追根溯源	为 Chunk 附加来源、权限等追溯信息	✅
08、Embedding 如何跨越语义鸿沟	语义向量化原理，解决同义词匹配不到的痛点	✅
第三部分：向量检索与生成
09、向量数据库：原理讲透再做选型	核心原理与 Milvus、Qdrant 等产品对比	✅
10、用 Milvus 构建向量检索实战	从建库、写入到语义检索完整流程	✅
11、混合检索 + 重排序提升召回率	向量 + 关键词混合检索与 Reranking 策略	✅
12、大模型总爱编答案？幻觉抑制攻略	Prompt 设计与生成控制，防止知识覆盖	✅
第四部分：工具调用与 MCP 协议
13、Function Call 让模型从聊天到干活	从查知识库扩展到调接口、查实时数据	✅
14、MCP 协议：AI 世界的 USB 接口	解决工具规模化管理，标准化注册调用	✅
15、MCP 的 Resources 与 Prompts 详解	只读数据源与 Prompt 模板复用机制	✅
16、JSON-RPC 2.0：MCP 的通信底座	MCP 中消息封装规范与结构说明	✅
17、MCP 为什么不用 HTTP 或 gRPC？	三种协议定位差异与选型理由对比	✅
18、MCP Java SDK 源码深度拆解	工具发现、路由与 Schema 生成机制	✅
19、工具调用架构：从能用到好用	职责划分、描述规范与错误处理原则	✅
20、工具调用上线翻车？四层防护兜底	超时重试、熔断降级、权限与可观测性	✅
第五部分：高级检索与对话
21、多轮对话为什么会失忆？记忆设计	对话历史注入 messages 解决上下文丢失	✅
22、用户问得模糊？查询重写来兜底	模糊追问扩展为完整检索语句	✅
23、意图识别：消息进来该走哪条路	闲聊、检索、工具调用、反问四路分发	✅
24、RAG 效果评估：别靠感觉用数据	量化指标替代主观判断与回归检测	✅
第六部分：流式通信
25、SSE：大模型为什么都用它做流式	单向推送规范、生命周期与异常处理	✅
26、Spring Boot + SSE 流式接口实战	手写全链路流式转发服务端实现	✅

Agent 系列 · 敬请期待

🚧 正在规划中，将覆盖 Agent 架构、多智能体协作、记忆与规划等核心主题。

💼 AI Agent 面试题库

精选 AI Agent 领域高频面试题，覆盖 Agent、RAG、LLM、MCP 等核心方向，数据来源于牛客、小红书、脉脉等多平台。

模块	说明	状态
Top50 必刷题	按出现频次×难度加权排序的 50 道高频核心题	✅
按分类浏览	Agent / RAG / Prompt / MCP 等分类维度	🔲
按公司浏览	字节、阿里、腾讯、百度等公司维度	🔲
趋势洞察	各分类题目数量分布与趋势变化	🔲

📁 项目结构

awesome-ai-handbook/
├── docs/
│   ├── growth/                                   # 🧭 成长路径
│   ├── interview/                                # 💼 AI Agent 面试题库
│   └── rag/                                      # 📖 RAG 体系教学
│       ├── llm-basics/                           #     大模型基础
│       ├── rag-core/                             #     RAG 核心链路
│       ├── vector-search-and-generation/         #     向量检索与生成
│       ├── tool-calling-and-mcp/                 #     工具调用与 MCP 协议
│       ├── advanced-retrieval-and-conversation/  #     高级检索与对话
│       └── streaming/                            #     流式通信
├── assets/                                       # 图片等资源
├── LICENSE
└── README.md

🤝 贡献

AI HandBook 开源小册仍在持续更新之中，欢迎您参与本项目，一同为读者提供更优质的学习内容。

📌内容修正：请您协助修正或在评论区指出语法错误、内容缺失、文字歧义、无效链接或代码 bug 等问题。
📝补充新内容：期待您贡献 RAG、Agent、LLM 等方向的原创教程或实践总结。
🔗推荐优质资源：欢迎推荐高质量的书单、课程、博客与开源项目。

欢迎您提出宝贵意见和建议，如有任何问题请提交 Issues。

感谢以下各位为此作出贡献的伙伴：

⭐ Star History

如果觉得有帮助，请点个 Star 支持一下！

📜 License

该项目遵循的是 Apache 2.0 许可协议——详情请参阅 LICENSE 文件。

🔔 持续更新中，建议 Star + Watch 追踪最新内容！

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
assets		assets
docs		docs
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

💡 为什么做这个项目

🧭 入门导航

📖 体系教学

RAG 系列 · 从零构建检索增强生成系统

Agent 系列 · 敬请期待

💼 AI Agent 面试题库

📁 项目结构

🤝 贡献

⭐ Star History

📜 License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

💡 为什么做这个项目

🧭 入门导航

📖 体系教学

RAG 系列 · 从零构建检索增强生成系统

Agent 系列 · 敬请期待

💼 AI Agent 面试题库

📁 项目结构

🤝 贡献

⭐ Star History

📜 License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages