Skip to content

nageoffer/awesome-ai-handbook

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Awesome AI Handbook

程序员转型 AI 工程师的全栈知识手册

GitHub stars GitHub forks License: Apache 2.0 Online Docs

💡 为什么做这个项目

大模型时代已经到来,越来越多的程序员希望转型 AI 方向,但面临几个痛点:

  • 知识碎片化:不知道从哪学起,找不到系统的学习路径。
  • 理论和实战脱节:看了很多论文但不会落地,缺少工程化实践。
  • 面试无从准备:不知道 AI 岗位考什么,缺少体系化的备战资料。

这个仓库就是为了解决这些问题 —— 一份持续更新的 AI 工程师成长手册,系统梳理 AI 基础、LLM、RAG、Agent 等核心知识,助你从入门到转型 AI 工程师。

🧭 入门导航

刚接触 AI?从这里开始,快速建立全局认知。

主题 说明 状态
程序员如何成长为 AI 工程师 AI 工程师定位、学习路线与技术栈全景
AI 学习资料推荐 精选书单、课程、博客与开源项目 🔲
AI 常见名词速查表 RAG、Agent、MCP、Skills、CLI 等核心术语一网打尽 🔲

📖 体系教学

按方向系统学习,每个方向从基础到进阶完整覆盖。

RAG 系列 · 从零构建检索增强生成系统

章节 关键内容 状态
第一部分:大模型基础
01、大模型到底是什么?核心概念讲透 Token、参数量、温度等核心术语全解析
02、手把手调用大模型 API 全流程 Chat Completions 协议,流式与非流式实现
03、好 Prompt vs 烂 Prompt 写法对比 对比差异写法,让模型精准基于内容作答
第二部分:RAG 核心链路
04、一张图看懂 RAG 全链路架构 全链路架构总览与企业实战项目背景
05、文档解析没你想的那么简单 Apache Tika 解析 PDF、扫描件等多格式
06、Chunk 分块策略决定检索质量 上下文窗口限制下的分块与精度优化
07、别忽视元数据:答案要能追根溯源 为 Chunk 附加来源、权限等追溯信息
08、Embedding 如何跨越语义鸿沟 语义向量化原理,解决同义词匹配不到的痛点
第三部分:向量检索与生成
09、向量数据库:原理讲透再做选型 核心原理与 Milvus、Qdrant 等产品对比
10、用 Milvus 构建向量检索实战 从建库、写入到语义检索完整流程
11、混合检索 + 重排序提升召回率 向量 + 关键词混合检索与 Reranking 策略
12、大模型总爱编答案?幻觉抑制攻略 Prompt 设计与生成控制,防止知识覆盖
第四部分:工具调用与 MCP 协议
13、Function Call 让模型从聊天到干活 从查知识库扩展到调接口、查实时数据
14、MCP 协议:AI 世界的 USB 接口 解决工具规模化管理,标准化注册调用
15、MCP 的 Resources 与 Prompts 详解 只读数据源与 Prompt 模板复用机制
16、JSON-RPC 2.0:MCP 的通信底座 MCP 中消息封装规范与结构说明
17、MCP 为什么不用 HTTP 或 gRPC? 三种协议定位差异与选型理由对比
18、MCP Java SDK 源码深度拆解 工具发现、路由与 Schema 生成机制
19、工具调用架构:从能用到好用 职责划分、描述规范与错误处理原则
20、工具调用上线翻车?四层防护兜底 超时重试、熔断降级、权限与可观测性
第五部分:高级检索与对话
21、多轮对话为什么会失忆?记忆设计 对话历史注入 messages 解决上下文丢失
22、用户问得模糊?查询重写来兜底 模糊追问扩展为完整检索语句
23、意图识别:消息进来该走哪条路 闲聊、检索、工具调用、反问四路分发
24、RAG 效果评估:别靠感觉用数据 量化指标替代主观判断与回归检测
第六部分:流式通信
25、SSE:大模型为什么都用它做流式 单向推送规范、生命周期与异常处理
26、Spring Boot + SSE 流式接口实战 手写全链路流式转发服务端实现

Agent 系列 · 敬请期待

🚧 正在规划中,将覆盖 Agent 架构、多智能体协作、记忆与规划等核心主题。

💼 AI Agent 面试题库

精选 AI Agent 领域高频面试题,覆盖 Agent、RAG、LLM、MCP 等核心方向,数据来源于牛客、小红书、脉脉等多平台。

模块 说明 状态
Top50 必刷题 按出现频次×难度加权排序的 50 道高频核心题
按分类浏览 Agent / RAG / Prompt / MCP 等分类维度 🔲
按公司浏览 字节、阿里、腾讯、百度等公司维度 🔲
趋势洞察 各分类题目数量分布与趋势变化 🔲

📁 项目结构

awesome-ai-handbook/
├── docs/
│   ├── growth/                                   # 🧭 成长路径
│   ├── interview/                                # 💼 AI Agent 面试题库
│   └── rag/                                      # 📖 RAG 体系教学
│       ├── llm-basics/                           #     大模型基础
│       ├── rag-core/                             #     RAG 核心链路
│       ├── vector-search-and-generation/         #     向量检索与生成
│       ├── tool-calling-and-mcp/                 #     工具调用与 MCP 协议
│       ├── advanced-retrieval-and-conversation/  #     高级检索与对话
│       └── streaming/                            #     流式通信
├── assets/                                       # 图片等资源
├── LICENSE
└── README.md

🤝 贡献

AI HandBook 开源小册仍在持续更新之中,欢迎您参与本项目,一同为读者提供更优质的学习内容。

  • 📌内容修正:请您协助修正或在评论区指出语法错误、内容缺失、文字歧义、无效链接或代码 bug 等问题。
  • 📝补充新内容:期待您贡献 RAG、Agent、LLM 等方向的原创教程或实践总结。
  • 🔗推荐优质资源:欢迎推荐高质量的书单、课程、博客与开源项目。

欢迎您提出宝贵意见和建议,如有任何问题请提交 Issues

感谢以下各位为此作出贡献的伙伴:

⭐ Star History

如果觉得有帮助,请点个 Star 支持一下!

Star History Chart

📜 License

该项目遵循的是 Apache 2.0 许可协议——详情请参阅 LICENSE 文件。

🔔 持续更新中,建议 Star + Watch 追踪最新内容!

About

🤖 AI 工程师的成长手册:从基础知识到 RAG、Agent 实战,涵盖学习路径与高频面试题。

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors