/images/avatar.png

论文阅读20 BEV感知系列-M^2 BEV

本文是了解BEV感知系列的第七篇论文阅读,来自港大、Nvidia等多方联合的工作,其提出了一种BEV视角下的检测与分割的统一框架,使用共享的主干网络,利用Lift的思想将多视角图像lift到3D空间,并对速度做了优化,最终实现高实时性以及高精度的性能。

论文阅读19 BEV感知系列-DETR3D

本文是了解BEV感知系列的第六篇论文阅读,是MIT, CMU, THU多家单位联合的工作,其基于DETR的二维检测工作,在多视角3D检测任务上开创了一种全新的方案,利用object queries隐式地编码了2D-3D的投影信息,从而避免了深度预测以及IPM类方法的投影误差。

论文阅读18 Focal SparseConv

本文是CVPR2022的oral,也是旷视以及港中文贾佳亚老师团队的合作工作。主要是对稀疏卷积的改进,通过预测卷积核中每个位置的特征对输出的贡献程度,定义了一种重要性分数,然后利于阈值截取满足条件位置的特征。等同于标准稀疏卷积以及子流形稀疏卷积的中间版本。