AI 算法工程师

李勇

人工智能硕士 ·多 Agent 系统 / NLP / 深度学习

我聚焦多 Agent 系统开发、自然语言处理与智能模型应用,擅长 LangChain/LangGraph 多 Agent 编排与手写 Agent 循环、RAG 管线、PyTorch 建模、LoRA 微调与模型压缩。这个网站展示我当前最核心的三个项目,涵盖多 Agent 考试系统、情感分析与手搓 Agent。

3
当前重点展示项目
95.83%
Qwen2 + LoRA 情感分类准确率
80/100
UNSW 人工智能硕士 GPA
成长路线

教育背景与求职方向

从本科阶段的数据与理工基础,到硕士阶段的 AI / NLP 深入学习,再到当前的求职方向,我把自己的成长路径整理成清晰时间线。

2018.09 - 2022.07

太原工业学院 · 生物工程学士

打下数理、编程与数据分析基础

完成数据结构、概率论与数理统计、线性代数、生物信息学等课程,获得学业奖学金和优秀毕业生荣誉。

数学基础数据结构统计分析
2023.09 - 2025.09

新南威尔士大学 · 人工智能硕士

系统学习机器学习、深度学习与 NLP

聚焦机器学习、深度学习、自然语言处理和统计学习理论,并围绕文本分类、情感分析与 LoRA 参数高效微调完成重点项目实践。

Machine LearningDeep LearningNLPLoRA
2026 求职中

目标岗位与方向

算法工程师 / 机器学习工程师 / AI 研发工程师

希望进入能够落地 NLP、LLM 应用、推荐或通用机器学习能力的团队,继续把研究思路转化为真实产品与工程成果。

NLPLLM 应用LoRA模型优化
关于我

以研究思维做项目,以工程方式讲清楚成果

我更重视能被清晰表达的作品:不仅展示模型效果,也把任务背景、技术路线、工程实现和业务价值整理成完整叙事。

我毕业于新南威尔士大学人工智能硕士项目,主攻自然语言处理、深度学习与 LLM 应用开发。本站重点展示三个项目:一个基于 LangChain + LangGraph 的多 Agent 智能考试系统、一个涵盖双分支建模与 Qwen2-LoRA 微调的情感分类项目,以及一个手写 Agent 循环 + RAG 的面试智能系统。

我比较重视两个能力:一是模型效果,二是结果表达。除了训练模型本身,我也会把任务背景、数据规模、技术路线、实验指标和个人贡献整理成完整作品,方便用于求职展示。

具备多 Agent 系统开发经验(LangChain/LangGraph + 手写 Agent 双路线),涵盖 Agent/RAG、NLP 与 LLM 微调。
熟悉从多 Agent 编排、RAG 检索、模型训练到蒸馏量化与 LoRA 微调的端到端流程。
具备全栈 AI 应用开发能力(FastAPI + Next.js + LangChain + DeepSeek/Claude API)。

核心技能

算法与模型开发
PyTorchLangChain/LangGraphTransformerBERTQwen2LoRA/QLoRA
数据处理与分析
PandasNumPyScikit-learn知识蒸馏INT8 量化数据增强
工程与部署
PythonFastAPINext.jsDockerDeepSeek APIRAGChromaDB

教育背景

新南威尔士大学 · 人工智能硕士
2023.09 - 2025.09 · GPA 80/100
核心课程:机器学习、深度学习、自然语言处理、统计学习理论
太原工业学院 · 生物工程学士
2018.09 - 2022.07
获得学业奖学金、优秀毕业生荣誉
能力补充

技能矩阵与个人优势

我把简历里的核心技能、工程能力和学习优势进一步拆开展示,方便用人方更快判断岗位匹配度。

算法与模型开发

PyTorchLangChain/LangGraphTransformerBERTQwen2LoRA/QLoRA

数据处理与分析

PandasNumPyScikit-learn知识蒸馏INT8 量化数据增强

工程与部署

PythonFastAPINext.jsDockerDeepSeek APIRAGChromaDB

个人优势

具备多 Agent 系统开发经验(LangChain/LangGraph + 手写 Agent 双路线),涵盖 Agent/RAG、NLP 与 LLM 微调。
熟悉从多 Agent 编排、RAG 检索、模型训练到蒸馏量化与 LoRA 微调的端到端流程。
具备全栈 AI 应用开发能力(FastAPI + Next.js + LangChain + DeepSeek/Claude API)。
学习能力强,能够快速上手新模型、新框架与新任务。
项目展示

近期重点项目

以下为近期完成的三个核心项目,涵盖 NLP 文本分类、情感分析与 CV 图像分类方向。

3
已整理的核心项目
95.83%
Qwen2 + LoRA 情感分类准确率
89.7%
ResNet18 + CBAM 图像分类准确率

NLP 多 Agent 智能考试系统

LangChain + LangGraph 多 Agent 协作 + RAG 动态出题 + 企业级工程

基于 LangChain + LangGraph + DeepSeek 的全栈多 Agent 智能 NLP 考试系统,采用 4 个 AI Agent(Proctor/Examiner/Grader/Reporter)协作完成考试全流程:从出题、监考、评分到报告生成,全部由 Agent 驱动。系统基于 RAG 从 16 个 NLP 知识领域的文档中检索相关知识片段,再由 LLM 动态生成高质量题目,支持 5 种题型、4 个难度等级和自适应难度调节。

4-Agent LangGraph 状态图编排
16 个 NLP 知识领域 RAG 动态出题
5 种题型 + 自适应难度 + 三层容错
LangChainLangGraphDeepSeekFastAPINext.js 14ChromaDBWebSocketEdge TTSDockerMonaco Editor

词典增强的 BERT 双分支情感分类与 Qwen2-LoRA 微调

从双分支建模到蒸馏量化与 LoRA 微调

基于 ChnSentiCorp 中文情感数据集(12,000 条),完成词典增强 BERT 双分支建模、DistilBERT 蒸馏与 INT8 量化,并新增 Qwen2-1.5B 的 LoRA/QLoRA 微调链路;其中双分支方案通过对每个 token 做情感打分与监督,显式增强模型对局部情绪线索的识别能力。

BERT 双分支准确率 95.50%
Qwen2 + LoRA 准确率 95.83%
仅训练约 9M 参数(0.6%)
PyTorchHugging FaceBERTQwen2LoRA/QLoRAPEFT知识蒸馏INT8 量化

NLP 面试智能 Agent 系统

手写 Agent 循环 + RAG 知识检索 + 多维度自动评分

从零手写 Agent 编排循环(无 LangChain),基于 Claude API Tool Use 模式,集成 ChromaDB 向量检索与 12 个 NLP 知识文档,实现面试出题、语音/文字作答、六维度自动评分与弱项自适应练习的全流程系统。

手写 Agent 循环(5 个 Tool)
12 个 NLP 知识文档 RAG 检索
六维度雷达图自动评分
FastAPINext.js 14Claude APIAnthropic SDKChromaDBRAGTool UseSSE 流式Web Speech APIRecharts
项目详解

更完整的项目表达

每个项目从概述、亮点、实现到结果四个维度展开,完整呈现技术路线与工程能力。

项目案例

NLP 多 Agent 智能考试系统

LangChain + LangGraph 多 Agent 协作 + RAG 动态出题 + 企业级工程

这个项目是对原手写 Agent 系统的全面工程升级:从单 Agent 手写循环升级为 LangGraph 状态图驱动的 4-Agent 协作架构,从 Claude API 切换到 DeepSeek 国产模型,从自由对话升级为结构化考试流程(40 题、计时、倒计时),并增加了插件化工具发现、中断恢复、三层容错、Agent 调用链追踪等企业级功能。

LangChainLangGraphDeepSeekFastAPINext.js 14ChromaDBWebSocketEdge TTSDockerMonaco Editor

核心亮点

4-Agent 协作架构:LangGraph StateGraph 编排 Proctor(规则策略调度,不调 LLM)、Examiner(RAG + LLM 出题)、Grader(客观题自动判分 + 主观题 AI 多维评分)、Reporter(LLM 生成 Markdown 报告),策略与执行分离。
RAG 动态出题:16 篇 NLP 知识文档 + ChromaDB 向量检索 + DeepSeek 动态生成选择题/判断题/简答题/编程题/案例分析题 5 种题型,非题库抽取,每次考试题目不重复。
企业级工程能力:插件化工具自动发现(零配置扩展)、中断恢复检查点(JSON 持久化)、三层容错(重试 + 超时 + 降级)、Agent 调用链追踪(可观测性)、Docker 一键部署。

实现过程

设计 LangGraph 状态图:定义 ExamState 全局状态,实现 init_exam → plan_question → generate_question → present_question → wait_for_answer → grade_answer → update_state → check_exam_end 节点与条件边。
实现 4 个 Agent:Proctor 管流程与策略(规则驱动不调 LLM),Examiner 管 RAG 检索 + LLM 出题,Grader 管客观题自动评分 + 主观题 LLM 多维评分,Reporter 管最终 Markdown 报告生成。
设计异步流水线并行策略:用户答题时 Grader 后台异步评分 + Examiner 预加载下一题,客观题 0 次 LLM 调用瞬间出分,整体减少约 45% LLM 调用。
实现企业级功能:tools/ 目录自动扫描注册工具、考试进度 JSON 检查点持久化、LLM 调用三层容错(指数退避重试 + 超时降级 + 备选题缓存)、Agent 调用链 JSON 日志追踪。
搭建 Next.js 14 前端:考试配置页、答题页(Monaco 代码编辑器 + 倒计时 + 进度条)、报告页(Recharts 雷达图 + Markdown 渲染 + 下载)、错题本、学习画像 + 考试历史。

结果总结

完成从单 Agent 到多 Agent 的架构升级,LangGraph 状态图清晰编排 4 个 Agent 的协作流程,面试中可展示对 LangChain/LangGraph 生态的深度理解。
异步流水线策略实现用户零等待体验:答题同时后台出题 + 评分,比原项目减少约 45% LLM 调用。
自适应难度 + 跨会话用户画像 + 错题本 + Edge TTS 语音播报 + WebSocket 实时计时 + Docker 一键部署,展示完整的全栈 AI 工程能力。
项目案例

词典增强的 BERT 双分支情感分类与 Qwen2-LoRA 微调

从双分支建模到蒸馏量化与 LoRA 微调

这个项目不是单点实验,而是一条完整的技术演进路线:先用词典监督增强 BERT 的局部情感感知,再把模型推进到蒸馏、量化和 Qwen2 LoRA 微调阶段,既展示建模创新,也展示工程落地能力。

PyTorchHugging FaceBERTQwen2LoRA/QLoRAPEFT知识蒸馏INT8 量化

核心亮点

设计词典增强的主辅双分支 BERT:主分支基于 [CLS] 做句级分类,辅助分支对每个 token 输出情感标签,用情感词典做监督,双分支准确率 95.50%(相比基线提升 1.75 个百分点)。
基于 4 层 DistilBERT 完成知识蒸馏与 INT8 量化,模型从 172MB 压缩到 91MB,准确率无损保持 93.75%。
新增 Qwen2-1.5B + LoRA/QLoRA 方案,仅训练约 9M 参数(0.6%),准确率达到 95.83%,LoRA 权重仅约 37MB。

实现过程

对 ChnSentiCorp 9,600 条训练样本做字符级 dropout 与词序打乱增强,扩展至约 19,200 条。
构建情感词典(800+ 情感词 + 否定词 + 程度副词),生成 token 级监督标签。
训练词典增强双分支 BERT,主分支做句级分类,辅助分支做 token 级情感预测。
将 12 层 BERT 蒸馏到 4 层学生模型(T=3.0, α=0.7),再做 INT8 动态量化。
接入 Qwen2-1.5B,通过 PEFT 注入 LoRA 适配器(r=8, α=16),QLoRA 4bit 加载训练。

结果总结

双分支设计相比基线提升 1.75 个百分点,token 级辅助任务验证了词典监督信号的有效性。
蒸馏 + 量化将模型从 393MB 压缩到 91MB,推理速度提升约 2.5 倍,准确率无损。
Qwen2 + LoRA 以仅 0.6% 可训练参数达到最优效果,补足了 LLM 微调能力展示。
项目案例

NLP 面试智能 Agent 系统

手写 Agent 循环 + RAG 知识检索 + 多维度自动评分

这个项目是我对 Agent 架构理解的完整体现:不依赖任何框架封装,直接基于 Anthropic SDK 的 tool_use 停止信号实现 Agent 决策循环,配合向量检索提供知识增强,再通过 SSE 流式输出与前端雷达图实现实时反馈。它展示了从 Agent 编排、RAG 管线到全栈工程的端到端能力。

FastAPINext.js 14Claude APIAnthropic SDKChromaDBRAGTool UseSSE 流式Web Speech APIRecharts

核心亮点

手写 Agent Orchestrator:基于 Claude API stop_reason 区分 tool_use 与 end_turn,循环执行工具调用直到模型自主决定结束,最多 10 轮,支持单次响应中的并行工具执行。
完整 RAG 管线:12 篇 NLP 知识文档按 ## 标题分块,使用 paraphrase-multilingual-MiniLM-L12-v2 生成多语言嵌入,存入 ChromaDB;检索时将 L2 距离转换为相关性分数并注入系统提示。
六维度自动评分体系(核心概念 30%、技术细节 25%、表达清晰度 15%、深度拓展 15%、实际应用 10%、面试技巧 5%),结合 Recharts 雷达图可视化与弱项自适应出题。

实现过程

设计 FastAPI 后端架构:Agent 编排层(orchestrator.py)、工具定义层(tools.py)、会话记忆层(memory.py)、RAG 检索层与 API 路由层分离,生命周期启动时自动构建向量索引。
实现 5 个 Agent 工具:search_knowledge_base(向量检索)、generate_question(出题并记录元数据)、grade_answer(准备评分材料)、get_session_stats(统计)、get_weak_areas(弱项识别),均以 JSON Schema 定义供 Claude 调用。
搭建 RAG 索引管线:加载 12 篇 Markdown 知识文档,按章节标题切分并提取 topic/formula 等元数据,通过 sentence-transformers 编码后写入 ChromaDB 持久化集合。
开发 Next.js 14 前端:ChatContainer 消息流 + InputBar 语音/文字双输入 + RadarChartView 六维评分雷达图 + SessionList 多会话管理,通过 SSE 实现逐 token 流式输出与工具执行状态实时回显。
实现弱项自适应逻辑:SessionMemory 按话题追踪得分历史,get_weak_areas 工具识别低分话题后注入系统提示,引导 Agent 自动调整出题方向和难度。

结果总结

完整实现了从出题→作答→检索→评分→弱项追踪的闭环流程,Agent 可自主决定何时调用工具、何时直接回复,体现了对 Tool Use 模式的深度理解。
项目代码零依赖 LangChain/CrewAI,Agent 循环、消息格式组装和工具结果注入均为手写实现,面试中可逐行解释 Agent 内部运作机制。
前后端分离的全栈架构,涵盖 SSE 流式传输、Web Speech API 语音输入、Recharts 数据可视化和多会话状态管理,展示了 AI 应用的完整工程能力。
简历信息

下载简历与联系方式

简历与联系方式汇总,方便招聘方快速了解基本情况。

李勇

目标岗位:算法工程师 / 机器学习工程师 / AI 研发工程师

求职方向
NLP / 深度学习 / 文本分类
到岗时间
2025 年 9 月毕业后随时
项目优势
强调实验结果、模型迭代和工程落地
可工作地点
杭州

联系方式

说明

如需了解更多项目细节,可点击上方项目卡片进入独立详情页,或直接下载简历获取完整信息。