tesla P40训练AI 特斯拉训练法_数据


注:下文作者Fred Lambert,由@冷酷的冬瓜 翻译整理。



tesla P40训练AI 特斯拉训练法_自动驾驶_02


特斯拉新申请了一项专利,内容是如何从其庞大的“用户车队”中获取训练数据,以训练其自动驾驶神经网络。

特斯拉公司申请了这项专利,但是特斯拉的人工智能和自动驾驶软件负责人安德烈·卡帕西(Andrej Karpathy)是这项专利申请的唯一发明人。

他描述了在应用程序中为深度学习训练收集数据的问题:

“用于自动驾驶等应用的深度学习系统是通过训练一个机器学习的模型来开发的。通常,深度学习系统的性能至少在一定程度上受到用于训练模型的训练集的质量的限制。在很多情况下,需要投入重要的资源到训练集的收集、管理和标注上。创建训练集所需的工作可能很重要,而且常常很繁琐。此外,为改进机器学习模型的特定用例的数据收集通常是困难的。”

特斯拉开发自动驾驶系统的方式与大多数其他公司大相径庭。

大多数其他公司利用相对较小的测试车队车辆收集数据并测试他们的系统,特斯拉则利用其成千上万的“用户车队”中装备的传感器阵列、通过“影子模式”来收集道路交通以及行驶数据并测试其无人驾驶系统。

通过车队收集的这些数据对特斯拉训练自动驾驶神经网络非常有价值。

但是,他们必须小心地收集和提供给网络的内容。

Karpathy在专利申请中指出:

“随着机器学习的模型变得越来越复杂,比如更深层次的神经网络、大型训练数据集的必要性也相应增加。与较浅的神经网络相比,这些较深的神经网络可能需要更多的训练实例,以确保其通用性。例如,一个神经网络可能被训练得对训练数据非常精确,但是这个神经网络可能不能很好地推而广之到看不见的未来的实例。在这个例子中,神经网络可能会受益于训练数据中包含的更多的实例。”

因此,工程师解释了他的专利方法,是在传输之前、将潜在的训练数据从源头分类:

“实例方法包括接收传感器数据并将神经网络应用于传感器数据处理。将触发器分类器应用于神经网络的中间结果,以确定传感器数据的分类器评分。根据至少部分分类器评分,决定是否通过计算机网络传输至少部分传感器数据。一旦确定为阳性,传感器数据就会被传输并用于生成训练数据。”

以下是专利中的一些示意图、流程图,解释了该方法:


tesla P40训练AI 特斯拉训练法_tesla P40训练AI_03


tesla P40训练AI 特斯拉训练法_tesla P40训练AI_04


tesla P40训练AI 特斯拉训练法_hql中获取前一天的数据_05


tesla P40训练AI 特斯拉训练法_hql中获取前一天的数据_06


tesla P40训练AI 特斯拉训练法_数据_07


tesla P40训练AI 特斯拉训练法_tesla P40训练AI_08