deepsort

DeepSORT的输出通常包括:
- 目标的ID:每个跟踪对象会被分配一个独一无二的识别号码。
- 目标的位置:通常是以边界框(bounding box)的形式给出,标识视频帧中目标的位置和大小。
- 目标的运动轨迹:算法会输出目标在视频中的移动轨迹。
- 特征向量:DeepSORT会提取目标的特征向量用于帧与帧之间的关联。
DeepSORT算法使用了一个结合了运动信息和外观信息的多重策略来关联连续帧中的检测对象,确保同一辆车在不同帧中能够被正确识别和追踪。其主要依据以下几点:
- 运动信息:通过卡尔曼滤波器预测车辆的位置,在连续帧之间建立起运动连续性。如果一个检测到的对象出现在卡尔曼滤波器预测的位置附近,算法会认为它很可能是同一目标。
- 外观信息:DeepSORT使用深度学习模型来提取目标的特征向量。这些特征向量代表了目标的外观,并且具有较强的区分度。
- 关联度量:算法计算新检测到的对象与现有轨迹的外观特征向量之间的相似度。当存在多个候选时,通过计算特征向量之间的余弦距离或者欧式距离等度量来选择最佳匹配项。
- 匈牙利算法:一种优化算法,用于在目标检测和已存在轨迹之间进行最优匹配,以最小化总的匹配成本。
DeepSort 需要 YOLO 检测算法来提供准确的边界框作为输入。无论 YOLO 的检测速度是快是慢,只要能够提供边界框,DeepSort 都能进行跟踪。但是,快速的 YOLO 检测会更有利于整体系统的实时性能表现。