返回首页
独立项目详情页

ResNet18 + CBAM 时尚物品多分类

轻量视觉分类与长尾样本优化实践

这是我在 CV 方向保留下来的代表性轻量项目。它不是单纯跑一个 ResNet18,而是围绕时尚物品多分类任务,比较不同骨干网络和损失函数组合,重点解决类别不均衡与细粒度配饰识别问题。

PyTorchCNNResNet18CBAM图像分类数据增强
查看 GitHub
准确率 89.7%
对比 CNN / MobileNetV2 / ResNet18
关注长尾分布下的配饰识别

项目挑战

时尚物品多分类的难点不只是做出一个分类器,而是很多类别具有细粒度差异,配饰类样本数量少、外观相近,容易受到长尾分布影响。

解决思路

我以 ResNet18 为主干,并集成 CBAM 注意力模块强化关键区域表达;同时对比 CNN、MobileNetV2 等基线模型,并结合数据增强与损失函数调优,提升模型对难分类样本的鲁棒性。

工程实现

项目中重点保留了模型对比、训练配置和结果分析过程,强调我不仅能搭建 CNN/ResNet 方案,也能围绕真实数据分布问题做实验设计与优化迭代。

项目价值

这个项目可以补充展示我在 CV 方向的基础能力:既理解卷积网络与注意力机制,也能处理长尾数据、类别混淆和轻量模型选型等实际问题。

项目拆解

亮点、过程与结果

核心亮点

在 ResNet18 主干上集成 CBAM 注意力模块,增强模型对服饰局部特征与关键区域的关注。
系统对比 CNN、MobileNetV2、ResNet18 等方案,兼顾准确率、训练效率与部署可行性。
结合数据增强与损失函数调优,针对长尾类别和配饰识别问题做重点优化。

实现过程

整理时尚物品图像数据集,分析类别分布,识别长尾类别与易混淆样本。
以基础 CNN 和 MobileNetV2 作为对照,再引入 ResNet18 + CBAM 验证注意力机制带来的增益。
通过数据增强、损失函数组合和训练策略迭代,持续优化配饰类样本的识别效果。

结果总结

最终准确率达到 89.7%,在轻量视觉分类任务中取得稳定表现。
形成了从模型选择、结构增强到类别不平衡处理的完整实验对比链路。
适合作为“除 NLP 外也具备 CV 建模与实验优化能力”的补充项目展示。