获课:www.bcwit.top/1083/
获取ZY↑↑方打开链接↑↑
第一章:目标检测基础
任务定义与挑战
目标检测 vs 图像分类 / 分割
核心挑战:多尺度、遮挡、小目标、背景干扰
基础概念
边界框(Bounding Box)表示与回归
交并比(IoU)与非极大值抑制(NMS)
锚框(Anchor Box)机制
数据集与评价指标
COCO、VOC、OpenImages 数据集解析
mAP(平均精度均值)计算与可视化
第二章:经典目标检测算法
两阶段检测框架
R-CNN(2014):候选区域提取 + 特征提取 + 分类回归
Fast R-CNN(2015):共享卷积特征与多任务损失
Faster R-CNN(2016):区域建议网络(RPN)的引入
R-CNN 系列
Mask R-CNN(2017):多任务学习与 RoIAlign 改进
一阶段检测框架
YOLOv1(2016):端到端检测与网格划分
YOLOv2(2017):锚框优化与多尺度训练
YOLOv3(2018):特征金字塔与 Darknet53
YOLOv4/YOLOv5(2020+):CSPNet、Mish 激活函数等优化
YOLO 系列
SSD(2016):多尺度特征图预测与默认框设计
Anchor-Free 方法
FCOS(2019):逐像素预测与中心度抑制
CenterNet(2019):关键点检测与中心点回归
第三章:现代算法与改进
特征增强与多尺度融合
FPN(特征金字塔网络)
BiFPN(双向特征金字塔)
ASFF(自适应空间特征融合)
损失函数优化
Focal Loss(解决正负样本不平衡)
GIoU/DIoU/CIoU Loss(改进边界框回归)
高效检测模型
RetinaNet(2017):Focal Loss 与特征金字塔
EfficientDet(2020):NAS 与复合缩放
YOLOX(2021):解耦头与标签分配策略
注意力机制与 Transformer
DETR(2020):基于 Transformer 的端到端检测
Deformable DETR(2021):可变形注意力模块
Focal Transformer(2023):多尺度上下文建模
第四章:目标检测实践指南
训练技巧
数据增强(MixUp、CutOut、Mosaic)
学习率调度(Cosine Annealing、Warmup)
预训练与迁移学习策略
模型部署与优化
量化(FP16/INT8)与剪枝
ONNX/TensorRT 加速推理
移动端部署(TFLite、NCNN)
实际案例分析
工业缺陷检测
自动驾驶多目标跟踪
医疗影像病灶定位
第五章:前沿趋势与挑战
多模态目标检测
图像 - 文本联合检测(CLIP+DETR)
3D 目标检测(PointPillars、CenterPoint)
小样本与零样本检测
元学习(Meta R-CNN)
基于扩散模型的生成式检测
长尾分布与开放词汇检测
类别不平衡处理(LDAM Loss)
Grounding DINO(开放词汇检测)
实时检测与硬件协同设计
YOLOv7-tiny、PP-YOLOE 等轻量级模型
边缘计算设备(Jetson Nano、RK3588)适配
理论 + 代码实战:配套 PyTorch/TensorFlow 实现,覆盖数据加载、模型训练、结果可视化全流程。
对比分析:提供主流算法的性能对比表(速度、精度、内存占用)。
前沿解读:跟踪 CVPR、ICCV 等顶会最新成果,解析工业界落地方案。
先修知识:熟悉 CNN 基础(ResNet、VGG)、PyTorch/TensorFlow 框架。
项目实践:通过 Kaggle 竞赛(如 Global Wheat Detection)巩固所学