项目挑战
时尚物品多分类的难点不只是做出一个分类器,而是很多类别具有细粒度差异,配饰类样本数量少、外观相近,容易受到长尾分布影响。
解决思路
我以 ResNet18 为主干,并集成 CBAM 注意力模块强化关键区域表达;同时对比 CNN、MobileNetV2 等基线模型,并结合数据增强与损失函数调优,提升模型对难分类样本的鲁棒性。
工程实现
项目中重点保留了模型对比、训练配置和结果分析过程,强调我不仅能搭建 CNN/ResNet 方案,也能围绕真实数据分布问题做实验设计与优化迭代。
项目价值
这个项目可以补充展示我在 CV 方向的基础能力:既理解卷积网络与注意力机制,也能处理长尾数据、类别混淆和轻量模型选型等实际问题。
项目拆解
亮点、过程与结果
核心亮点
在 ResNet18 主干上集成 CBAM 注意力模块,增强模型对服饰局部特征与关键区域的关注。
系统对比 CNN、MobileNetV2、ResNet18 等方案,兼顾准确率、训练效率与部署可行性。
结合数据增强与损失函数调优,针对长尾类别和配饰识别问题做重点优化。
实现过程
整理时尚物品图像数据集,分析类别分布,识别长尾类别与易混淆样本。
以基础 CNN 和 MobileNetV2 作为对照,再引入 ResNet18 + CBAM 验证注意力机制带来的增益。
通过数据增强、损失函数组合和训练策略迭代,持续优化配饰类样本的识别效果。
结果总结
最终准确率达到 89.7%,在轻量视觉分类任务中取得稳定表现。
形成了从模型选择、结构增强到类别不平衡处理的完整实验对比链路。
适合作为“除 NLP 外也具备 CV 建模与实验优化能力”的补充项目展示。