
人们对于机器学习除了要求快捷,还要求识别准确。但真正的“精准”用在机器学习上是不恰当的,自动驾驶的实现目标最多是超过人类识别率多少个点而已,没办法做到百分百绝对安全,这是机器学习的数学本质决定的。人眼对动态物体的识别能力要好于静态物体,比如说,森林里有一只小兔子,如果它一直静止不动,那人眼很难发现,但是它只要在你视线范围内一运动,就马上能够看见,而对于机器来说,静态与动态的识别没有显著的难度差异。

实际应用中可以根据车辆的运动方向,只检测自己行动方向上面且在一定距离范围内的物体,没必要对所有物体进行识别。不管鬼探头,还是对面来车越了线,不都是在自己的预订行动方向上面吗?所以,靠视觉识别的车通常都非常依赖地面的交通辅助线,和本车IMU来确认自己未来将要经过的区域。只在这个区域内做障碍物识别就行了。
目前许多视觉识别技术就应用在车载场景,例如用于识别路况等。但目前机器视觉算法的障碍物的种类还不够丰富,比如水坑、窨井坑、动物、塑料袋、塑料瓶、飞痰、碰瓷党、醉汉、飞机、大炮、轮船、卫星等等。
其实还有一个方法计算距离。就是根据路面和AI摄像头或IPC摄像头的高度。此算法在路面凸起或凹陷时有误差,不过配合运动感应或GPS可以适当修正。单目不能直接测距,是基于一定的假设。比如根据摄像头外参三角近似测距就是基于水平路面的假设。这种方法受到自车颠簸的影响很大,尤其对较远处车辆的测距误差几乎是不可接受的。所以,一方面,我们需要多种方法来感知自车的颠簸来进行补偿,另一方面也会利用基本不受颠簸影响的车辆宽度等,来综合得到更优的测距结果。
参考香农公式,需要知道振动带宽、振动强度、检测噪声、视觉识别物体需要的信息量,就可以计算理论上的平均识别正确率。原理像合成孔径雷达,通过其他传感器检测摄像头运动信息,获取AI摄像头和IPC摄像头在不同位置的图像,就等效于摄像头阵列了,是这个原理吧?这种办法应该特别依赖IPC摄像头运动检测的精度吧。比如在无人驾驶技术和辅助驾驶系统都还不够成熟时,可以先把这项技术运用在行车记录仪上。
因为毕竟辅助驾驶系统如果出问题的话是有安全隐患的,但是反正行车记录仪仅仅是记录保存,不会有任何风险。其实,十年前的科学家就有类似的设想,当时觉得利用汽车挡风玻璃投射出前方障碍物的距离,速度等到信息。和战斗机的HUD类似。那时候还没有这么厉害的视觉识别图像分析算法,如果在前车灯的位置集成两个摄像头,利用图像差来结合成3D画面会不会算得更好?
(来源自网络,侵权即删)
TAG|视觉识别|机器学习|AI摄像头|IPC摄像头