105.Agent智能体梳理
# 一、AI Agent 核心概念与系统设计
# 1.1 Agent 架构与组成
- 什么是 AI Agent?它由哪几部分组成?
- 如何理解 Perception(感知)、Planning(规划)、Action(执行)在智能体中的角色?
- LangChain/ReAct/AutoGPT/AgentVerse/Autogen 等框架有何差异?
- 如何构建一个具备记忆、反思、执行能力的 Agent 系统?
# 1.2 Agent 框架实现细节
- 在你使用的框架中,AgentExecutor 的职责是什么?是否需要自定义?
- Agent 的调用链路是如何执行的?LLM、Tools、Prompt 三者的依赖关系和执行顺序?
- 如何设计一个支持多 Tool 调用、多轮思考的 Agent 执行逻辑?
# 1.3 工具(Tools)机制
- Tool 是如何注册的?如何实现自定义工具调用?
- 如何在 Agent 中使用多工具组合实现复杂任务?是否支持并行执行?
- 工具调用失败如何处理?是否有重试、回滚或兜底策略?
# 二、服务端开发与系统架构设计
# 2.1 系统设计能力
- 如何设计一个支持百万级调用的 Agent 系统?
- 任务编排框架如何设计?如何进行异步任务/有状态任务管理?
- 如何实现对话上下文的管理和多轮对话的状态维护?
- 如何处理工具调用与模型调用之间的依赖与并发?
# 2.2 微服务与接口设计
- 如何为 Agent 系统设计 RESTful / gRPC API?
- 多 Agent 协同场景下,如何设计调用路由和上下文隔离?
- 如何设计支持水平扩展的 Agent 服务架构?
# 2.3 性能与稳定性
- 高并发下如何保证 Agent 响应速度与可用性?
- LLM 推理接口如何加速(缓存、并发、Batching)?
- 如何做限流、熔断、监控、报警?
# 三、LLM 接入与推理服务设计
# 3.1 模型接入
- 如何接入 OpenAI、DeepSeek、Claude、百度文心一言等模型?
- 模型切换、路由、集成如何做?支持 fallback 吗?
# 3.2 推理优化
- 多轮对话中如何维护上下文窗口?如何压缩历史?
- Prompt 是如何构建的?是否使用 PromptTemplate?
- 如何处理 token 溢出、频控限制、流式输出等问题?
# 3.3 安全与权限
- 如何隔离用户会话和调用权限?如何防 prompt injection?
- 在 SaaS 多租户场景下,如何管理 token、API key、访问权限?
# 四、RAG 与知识增强应用
# 4.1 向量检索与知识库接入
- 如何将企业文档接入 RAG?嵌入模型如何选型?
- 向量检索系统如何搭建?使用过哪些库(FAISS、Milvus、Weaviate、Chroma)?
- Chunk 策略、Embedding 粒度如何选择?
# 4.2 RAG 系统优化
- RAG 的典型问题有哪些?(如召回误差、上下文污染、事实幻觉)
- RAG 中如何实现多轮查询增强?如何优化检索-生成协同?
- 是否结合结构化数据做 Hybrid Search?
# 五、模型能力增强(记忆、反思、规划等)
# 5.1 记忆机制
- 哪些类型的记忆机制你实现过?(短期记忆、长期记忆、摘要记忆)
- LangChain 中的 ConversationBufferMemory、SummaryMemory 如何选择?
# 5.2 多智能体协同
- 多 Agent 协同工作流如何设计?是否需要中控 Agent?
- Agent 间如何通信?使用什么消息机制?(如消息队列、事件驱动)
# 5.3 自动反思与任务分解
- 实现过 Self-Reflective Agent 吗?如何设计反思模块?
- 如何结合任务规划(Planner)与执行器(Executor)完成自动任务拆解?
# 六、工具栈与工程落地
# 6.1 技术栈熟悉度
- 使用 Python 实现 Agent 系统时,哪些组件是核心?有哪些工程实践经验?
- Go/Java 在智能体系统中的适用场景?
- 是否使用过 FastAPI / gRPC / Celery / Redis / Kafka 等?
# 6.2 DevOps 与部署
- Agent 系统如何部署上线?是否支持 A/B 测试或灰度发布?
- 如何监控 Agent 服务?是否集成 Prometheus / Grafana / Sentry?
- 有无模型服务部署经验?是否使用过 Triton、Ray Serve、vLLM 等?
# 七、AI 基础与前沿技术理解
# 7.1 基础原理
- Transformer 工作机制?Attention 计算过程?
- 位置编码、上下文窗口、tokenization 机制?
# 7.2 模型生态与趋势
- OpenAI function calling 与 Tool calling 有何区别?
- LLM 的 Agent 模型方向未来趋势?Open Agent、AutoGen 等的发展?
- 哪些新技术你正在关注?如何看待 GPT-4o、Claude 3 的多模态能力?
# 八、跨团队协作与产品对接
# 8.1 需求落地与产品沟通
- 你如何推动 AI Agent 技术快速在业务中落地?
- 与产品合作中,如何解释 AI 模型的不可控性或 hallucination 风险?
- 如何定义 Agent 的功能边界与用户体验?
# 8.2 文档与流程
- 你如何编写 Agent 系统的技术文档?
- 如何设计 agent 服务的 SDK / 调用文档,方便他人集成?
# 九、场景案例题(模拟题)
# 9.1 设计题
- 设计一个用于企业知识问答的 Agent 系统,说明其组件、数据流、部署方式。
- 如何为财务审计流程设计一个 AI Agent,支持文档审核、规则校验和反馈?
# 9.2 排错题
- Agent 执行时调用错误工具,如何定位问题?如何做日志追踪与重放?
# 9.3 优化题
一个 Agent 系统在高并发场景下延迟高,如何排查与优化?
基于LLM的聊天机器人与自主智能体
- https://github.com/YidaHu/chatbot/tree/main
- Llm + tools 工具 + memory
「赛博华佗」🩺 cyber-doctor 你的健康小管家
- https://github.com/Warma10032/cyber-doctor
AgentsChain 智能体
- https://github.com/lalolv/AgentsChain/tree/develop
Azure OpenAI API微软中国区申请
https://ssw9noe1h6.feishu.cn/wiki/Q657wjtTGiU0m9krwFKciLZUnie
注册邮箱:访问 https://signup.live.com