CVPR 2022 | Curve Modeling:车道线检测新工作

计算机视觉life”,选择“星标”

快速获得最新干货

StrongerTang

来源丨https://zhuanlan.zhihu.com/p/496228909

转载自计算机视觉工坊,仅用于学术分享

分享前段时间看的一篇车道线检测方向的新工作,也是中了最近公开结果的2022CVPR,是上海交大、华东师大、香港城市大学和商汤科技合作完成的,代码已经开源。

论文链接: https://arxiv.org/abs/2203.02431

代码链接:https://github.com/voldemortX/pytorch-auto-drive

简介

Lane detection strategies

如上图所示,基于深度学习的车道线检测方法可分为三大类: 基于分割的方案(图中绿色示例)、 基于点检测的方案(图中蓝色示例)和 基于多项式曲线的方案(图中黄色示例)。

其中基于分割和点检测的方案一般效果性能更好,但基于分割方案和基于点检测方案的表征是局部的、间接的,且在多项式曲线中的抽象因子(a, b, c, d)难于优化。为此,文章提出了基于三次B′ezier 曲线的方案,即上图中的红色曲线和虚线框,因为贝塞尔曲线具有易于计算、稳定、转换自由等特点。此外,也设计了基于可形变卷积的特征翻转融合模块,进行车道线对称属性的探究。

最终文章的方案在保持高速度(>150FPS)和小尺寸(<10M)的同时,在车道线检测基准数据集LLAMAS上取得了新的SOTA表现,同时在TuSimple和CULane数据集上取得了竞争力的精度表现。

B′ezier 曲线相关补充

贝塞尔曲线(以3阶为例)是依据四个位置任意的点坐标绘制出的一条光滑曲线。其通过控制曲线上的四个点(起始点、终止点以及两个相互分离的中间点)来创造、图形。其中起重要作用的是位于曲线中央的控制线。这条线是虚拟的,中间与贝塞尔曲线交叉,两端是控制端点。移动两端的端点时贝塞尔曲线改变曲线的曲率(弯曲的程度);移动中间点(也就是移动虚拟的控制线)时,贝塞尔曲线在起始点和终止点锁定的情况下做均匀移动。

对于任意阶贝塞尔曲线,可通过以下公式进行表示:

文章也对贝塞尔曲线和多项式方程曲线进行了对比实验,如下表所示,表中指标是在TuSimple测试集上的结果,越低越好。

通过上述实验,文章选择使用经典的3阶贝塞尔曲线(n=3), 因为实验中发现3阶足够用来进行车道线建模,同时与3阶多项式曲线相比具有更好的拟合能力, 而3阶多项式曲线是之前众多方案中的基础方程(论文中如此说),实际小汤在自己参与的部分工作及和同行交流中得知,目前各家实际量产中的方案也大都为3阶多项式曲线方案。文章也指出更高阶的曲线并没有带来相应的性能提升,但却会由于高自由度而造成不稳定性。

The Proposed Architecture

对于输入的RGB图像,经过特征提取得到的特征图送入 特征翻转融合模块,得到 CxH/16xW/16 大小的特征图,再经过平均池化得到的CxW/16的特征图,最后经过一个分类和一个回归分支得到相应的贝塞尔曲线结果。

Feature Flip Fusion

特征翻转模块是文章的主要工作之一。

通过对车道线作为历史曲线来建模,文章集中于各条车道线的几何特性,如瘦、长、连续等特性。当从前视相机的角度来考虑车道线的全局结构事,道路具有空间等分的车道线,近似于对称,例如。左边车道线的存在可能暗示其右侧存在对应的车道线。文章对这种对称性进行建模,为此设计了特征翻转模块。

an auxiliary binary segmentation branch

文章还在ResNet backbone上设计了一个额外的二分类分割分支,旨在加强对于空间细节的学习。并通过实验发现这个额外的分支只有在和特征翻转融合模块一起工作时才起作用。这是因为分割任务的定位有利于提供一个空间上更准确的特征图,这个反过来支持翻转特征图之间更准确融合。

这个额外的二分类分割分支只在训练时使用,推理时关掉。

文章通过上图所示的Grad-CAM可视化效果对这一设计的影响进行了说明,详细细节可以阅读原文。

Overall Loss

因为在车道线检测数据集中,并不存在正负样本不平衡问题,所以分类和分割都使用了简单的加权交叉熵损失。

Experiments

Results on test set of CULane and TuSimple. *reproduced results in our code framework, best performance from three random runs. **reported from reliable open-source codes from the authors.

ablation studies

可视化示例:

文章给出的是效果比较好的结果,但是 在匝道、大拐弯等场景效果还是有问题,感兴趣的朋友可以自己跑一下代码看看。(以下四张是 用文章开源代码和权重跑的结果,感兴趣的可以自己跑一下看看)

最后,由于自己对车道线看的不多,写作能力也有限,有不对的地方欢迎大家批评指正。也欢迎 对车道线检测、自动驾驶、计算机视觉等方向感兴趣的朋友加入 自动驾驶交流群一起学习一起玩!!

独家重磅课程官网:cvlife.net

1、视觉SLAM基础: 刚看完《视觉SLAM十四讲》,下一步该硬扛哪个SLAM框架 ?

2、VIO灭霸:VIO天花板ORB-SLAM3第2期上线!(单/双目/RGBD+鱼眼+IMU+多地图+闭环)

3、机器人导航运动规划: 机器人核心技术运动规划:让机器人想去哪就去哪!

4、详解Cartographer: 谷歌开源的激光SLAM算法Cartographer为什么这么牛X?

5、深度学习三维重建 总共60讲全部上线!详解深度学习三维重建网络

6、三维视觉基础 详解视觉深度估计算法(单/双目/RGB-D+特征匹配+极线矫正+代码实战)

7、 VINS:Mono+Fusion SLAM面试官:看你简历上写精通VINS,麻烦现场手推一下预积分!

8、图像三维重建课程:视觉几何三维重建教程(第2期):稠密重建,曲面重建,点云融合,纹理贴图

9、系统全面的相机标定课程:单目/鱼眼/双目/阵列 相机标定:原理与实战

全国最棒的SLAM、三维视觉学习社区↓

技术交流微信群

投稿、合作也欢迎联系:simiter@126.com

— 版权声明 —

本公众号原创内容版权属计算机视觉life所有;从公开渠道收集、整理及授权转载的非原创文字、图片和音视频资料,版权属原。如果侵权,请联系我们,会及时删除。

来源:SD科技制造

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

检测之家检测之家
上一篇 2022年3月27日 上午5:10
下一篇 2022年3月27日 下午5:26