RTMO:最强姿态识别模型,超越YOLO-pose
简介 相关工作 方法 实验 总结
本文介绍了一种名为RTMO的实时多人姿态估计框架,它采用了一种无缝集成坐标分类的方法,使用双1-D热图来表示关键点,同时在保持高速度的同时实现了与两阶段自顶向下方法相当的准确性。RTMO采用了动态坐标分类器和定制的损失函数来学习热图,以解决坐标分类和密集预测模型之间的不兼容性。RTMO在COCO数据集上的表现优于现有的一阶段姿态估计器,具有更高的准确性和更快的速度。最大的模型RTMO-l在COCO val2017上达到了74.8%的AP,单个V100 GPU上的帧率为141 FPS。