论文阅读21 BEV感知系列-PETR
本文是了解BEV感知系列的第八篇论文阅读,来自旷视,其主要针对DETR3D进行改进,优化其object query部分,通过Lift的方式编码3D的position encoding,进而联合object query共同学习目标信息。
本文是了解BEV感知系列的第八篇论文阅读,来自旷视,其主要针对DETR3D进行改进,优化其object query部分,通过Lift的方式编码3D的position encoding,进而联合object query共同学习目标信息。
本文是了解BEV感知系列的第七篇论文阅读,来自港大、Nvidia等多方联合的工作,其提出了一种BEV视角下的检测与分割的统一框架,使用共享的主干网络,利用Lift的思想将多视角图像lift到3D空间,并对速度做了优化,最终实现高实时性以及高精度的性能。
本文是了解BEV感知系列的第六篇论文阅读,是MIT, CMU, THU多家单位联合的工作,其基于DETR的二维检测工作,在多视角3D检测任务上开创了一种全新的方案,利用object queries隐式地编码了2D-3D的投影信息,从而避免了深度预测以及IPM类方法的投影误差。
本文是CVPR2022的oral,也是旷视以及港中文贾佳亚老师团队的合作工作。主要是对稀疏卷积的改进,通过预测卷积核中每个位置的特征对输出的贡献程度,定义了一种重要性分数,然后利于阈值截取满足条件位置的特征。等同于标准稀疏卷积以及子流形稀疏卷积的中间版本。
本文是了解BEV感知系列的第五篇论文阅读,来自亚琛工大,其针对IPM投影算法中的前景前景遮挡问题进行探究,标注遮挡类别,让网络预测遮挡类别,代码已开源。
本文是了解BEV感知系列的第四篇论文阅读,来自Nvidia,Lift是指将相机表达提升到三维视锥,Splat指将各个相机的三维视锥通过外参以及PointPillar,拍平到BEV视角。通过独特的lift过程实现二维到三维的映射。