深度学习之目标检测常用算法原理+实践精讲(完结)

buwl3333 · · 24 次点击 · · 开始浏览    
获课:www.bcwit.top/1083/ 获取ZY↑↑方打开链接↑↑ 第一章:目标检测基础 任务定义与挑战 目标检测 vs 图像分类 / 分割 核心挑战:多尺度、遮挡、小目标、背景干扰 基础概念 边界框(Bounding Box)表示与回归 交并比(IoU)与非极大值抑制(NMS) 锚框(Anchor Box)机制 数据集与评价指标 COCO、VOC、OpenImages 数据集解析 mAP(平均精度均值)计算与可视化 第二章:经典目标检测算法 两阶段检测框架 R-CNN(2014):候选区域提取 + 特征提取 + 分类回归 Fast R-CNN(2015):共享卷积特征与多任务损失 Faster R-CNN(2016):区域建议网络(RPN)的引入 R-CNN 系列 Mask R-CNN(2017):多任务学习与 RoIAlign 改进 一阶段检测框架 YOLOv1(2016):端到端检测与网格划分 YOLOv2(2017):锚框优化与多尺度训练 YOLOv3(2018):特征金字塔与 Darknet53 YOLOv4/YOLOv5(2020+):CSPNet、Mish 激活函数等优化 YOLO 系列 SSD(2016):多尺度特征图预测与默认框设计 Anchor-Free 方法 FCOS(2019):逐像素预测与中心度抑制 CenterNet(2019):关键点检测与中心点回归 第三章:现代算法与改进 特征增强与多尺度融合 FPN(特征金字塔网络) BiFPN(双向特征金字塔) ASFF(自适应空间特征融合) 损失函数优化 Focal Loss(解决正负样本不平衡) GIoU/DIoU/CIoU Loss(改进边界框回归) 高效检测模型 RetinaNet(2017):Focal Loss 与特征金字塔 EfficientDet(2020):NAS 与复合缩放 YOLOX(2021):解耦头与标签分配策略 注意力机制与 Transformer DETR(2020):基于 Transformer 的端到端检测 Deformable DETR(2021):可变形注意力模块 Focal Transformer(2023):多尺度上下文建模 第四章:目标检测实践指南 训练技巧 数据增强(MixUp、CutOut、Mosaic) 学习率调度(Cosine Annealing、Warmup) 预训练与迁移学习策略 模型部署与优化 量化(FP16/INT8)与剪枝 ONNX/TensorRT 加速推理 移动端部署(TFLite、NCNN) 实际案例分析 工业缺陷检测 自动驾驶多目标跟踪 医疗影像病灶定位 第五章:前沿趋势与挑战 多模态目标检测 图像 - 文本联合检测(CLIP+DETR) 3D 目标检测(PointPillars、CenterPoint) 小样本与零样本检测 元学习(Meta R-CNN) 基于扩散模型的生成式检测 长尾分布与开放词汇检测 类别不平衡处理(LDAM Loss) Grounding DINO(开放词汇检测) 实时检测与硬件协同设计 YOLOv7-tiny、PP-YOLOE 等轻量级模型 边缘计算设备(Jetson Nano、RK3588)适配 理论 + 代码实战:配套 PyTorch/TensorFlow 实现,覆盖数据加载、模型训练、结果可视化全流程。 对比分析:提供主流算法的性能对比表(速度、精度、内存占用)。 前沿解读:跟踪 CVPR、ICCV 等顶会最新成果,解析工业界落地方案。 先修知识:熟悉 CNN 基础(ResNet、VGG)、PyTorch/TensorFlow 框架。 项目实践:通过 Kaggle 竞赛(如 Global Wheat Detection)巩固所学
24 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传