NLP 多 Agent 智能考试系统
LangChain + LangGraph 多 Agent 协作 + RAG 动态出题 + 企业级工程
这个项目是对原手写 Agent 系统的全面工程升级:从单 Agent 手写循环升级为 LangGraph 状态图驱动的 4-Agent 协作架构,从 Claude API 切换到 DeepSeek 国产模型,从自由对话升级为结构化考试流程(40 题、计时、倒计时),并增加了插件化工具发现、中断恢复、三层容错、Agent 调用链追踪等企业级功能。
项目挑战
原手写 Agent 项目在面试中被反馈“工程复杂度不足”:单 Agent 架构没有多 Agent 协作、缺少考试流程控制(计时/顺序出题)、评分完全依赖 LLM 缺乏客观评估、没有 TTS 语音播报。需要升级为具备企业级工程特征的多 Agent 系统。
解决思路
核心设计是“4-Agent 协作 + LangGraph 状态图编排”:Proctor 作为协调者用纯规则策略调度(不调 LLM),Examiner 通过 RAG + LLM 动态生成题目(非题库抽取),Grader 客观题自动判分 + 主观题异步 LLM 评分,Reporter 汇总生成详细报告。流水线并行策略让用户答题时后台同时出题和评分。
工程实现
项目按 agents / graph / rag / tools / session / memory / observability / resilience 八层组织。LangGraph 状态图定义了完整的考试循环节点与条件边;tools/ 目录支持插件化自动发现;session/ 实现中断恢复检查点;resilience/ 实现重试+超时+降级三层容错;observability/ 记录每个 Agent 的调用耗时和 token 消耗。Docker Compose 一键部署前后端。
项目价值
这个项目最能体现“从手写到框架”的技术演进:先用原项目展示对 Agent 底层机制的理解,再用本项目展示 LangChain/LangGraph 框架能力和工程落地能力。4-Agent 协作、流水线并行、三层容错、插件化工具等设计体现了生产环境的架构思维。