global attentionDetection head基于camera view的目标检测方法有两种输出方式表达,一种是纯分割区域,另一种是分割与检测框。纯分割区域表达纯分割的输出是基于camera view的模型直接、的一种输出。在原始3D点云中,尤其是远处的点,点与点之间的距离都较远,如bev投影图,造成点特征提取时很难融入上下文信息。而camera view投影图将点云中的点聚拢,每个点都可以很方便的获得更大范围的上下文信息,这种投影方式更适合分割任务。如在SqueezeSeg[3]和PointSeg[4]两篇文章中,都直接将分割作为终任务目标,但是为了得到更好的联通区域,需要增加较多的后处理。如在SqueezeSeg[3],在模型输出后又增加了crf提高分割效果。在PointSeg[4]中,使用RANSAC将异常点剔除,如下图,行为模型输入,*二行为模型直接的预测输出,*三行为将模型输出的camera view图反投影得到的点云图,*四行为经过ransac后再反投影得到的点云图,对比*三行和*四行对应的图可以看出,ransac有效的抑制很多离目标较远的点。
将两组特征联合作为proposal的pooling特征。
Roi aware Point Cloud Pooling Roi grid pooling[6]与上面两种pooling方法不同的是,并没有将proposal通过voxel得到固定大小的特征图,而是根据pv-rcnn[6]中提出的key point信息,将proposal用6*6*6=216个grid points表达,grid points是从proposal中的key points均匀采样获得,且RoI-grid point features提取过程和key point feature提取过程是相似的。简单来说是以grid point为中心,r为半径的区域内提取不同尺度、不同感受野的特征,在使用2层的MLP网络获得终的特征表达,如图7所示。
Roi grid point feature extraction总结:目前基于point-wise feature的目标检测方法还处于研究阶段,效率无法保证,精度还未在真实自动驾驶车上,但由于该方法直接从点云提取特征,大的保留了点云的原始信息,比较有潜力得到更好的效果。参考文献:
1、PointPillars: Fast Encoders for Object Detection from PointClouds
2、VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
3、PIXOR: Real-time 3D Object Detection from Point Clouds
4、Multi-View 3D Object Detection Network for Autonomous Driving5、YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud6、SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud7、PointSeg: Real-Time Se ** ntic Segmentation Based on 3D LiDAR Point Cloud8、LaserNet: An Efficient Probabilistic 3D Object Detector for Autonomous Driving
1. 特征提取:在proposal中随机筛选N个点,1)获得阶段的点特征;2)获得N个点的坐标,并用如下图5所示的canonical transfor ** tion得到与原坐标系无关的坐标特征。两种特征联合在一起,作为proposal中点的特征表达
2. Voxel表达:将不同大小的proposal,通过voxel统一化到相同大小:dl = 6,dw = 6,dh = 6
3. 使用VFE layer提取终特征
canonical transfor ** tionRoi aware Point Cloud Pooling[5]整体流程如下图6所示,与STD[9]中的pooling方法类似,先将proposal分割成固定大小的voxel,如14×14×14,然后再提取voxel特征表达:
· RoIAwareMaxPool:使用的是阶段输出的point-wise se ** ntic part feature,在voxel中计算 ** x pooling
· RoIAwareAvgPool:使用的是proposal中经过canonical transfor ** tion点坐标特征和segmentation score,在voxel中计算avg pooling