焦点信息:搞事情的 DriveGPT,谁有数据谁无敌
ChatGPT 被认为是 AI 的 "iPhone 时刻 ",作为一种 " 平权 " 工具正在 " 进化 " 内容生产、工业设计等多个领域。
(相关资料图)
现在的问题是,如果和同样用 AI 驱动的自动驾驶技术结合,会产生什么样的化学反应?
实际上,事情已经发生了。
自动驾驶技术公司 " 毫末智行 ",正在用驾驶场景数据训练与自动驾驶有关的大模型。
这家初创公司在 4 月 11 日的 "HAOMO AI DAY" 上,正式发布了业内首个自动驾驶生成式大模型 DriveGPT,并将其命名为 " 雪湖 · 海若 "。
官方说法是,DriveGPT" 雪湖 · 海若 " 是大模型技术落地自动驾驶的新范式。
这引发了人们的广泛兴趣,或许将是一场变革的开端——比如加速把人类带入自动驾驶时代。
DriveGPT" 雪湖 · 海若 "自动驾驶的天才小帮手
和 ChatGPT 类似,DriveGPT" 雪湖 · 海若 " 采用 Transformer 模型,训练自动驾驶的认知决策模型。
不同的一点在于,ChatGPT 是通过自然语言进行训练," 雪湖 · 海若 " 则用驾驶场景数据推进模型训练。
类似之处是,DriveGPT" 雪湖 · 海若 " 和 ChatGPT 均有持续自我学习、不断优化的能力,最终目的是实现 " 拟人化 " 驾驶。
这让其看上去像是自动驾驶技术的天才小帮手。
因为自动驾驶的一大难点在于无法预测潜在的 "Corner case"(边缘场景)——比如高速路上突然掉落的轮胎、路边冲出的野猪等无法提前预测的情况。
这种 "Corner case" 具备随机属性,而以往的自动驾驶必须进行海量数据标注,即搞到尽可能多的实际路况,才能训练认知决策模型。
这是一个几乎不可能完成的任务——在类似于中国这样的基建狂魔国家,每时每刻道路都在发生变化。
但生成式大模型通过 AIGC,能够为自动驾驶系统提供 " 合成数据 ",提供任何人类能够想象到的驾驶场景,而且还不涉及用户隐私问题。
这让其收集数据的效率和成本,远超真实驾驶环境。
不能说大模型一定能够解决所有 "Corner case",但却能够有效应对这个痛点,模型算法的质量大幅提升。
某种程度上,这甚至重塑了汽车智能化技术路线。
首次搭载车型是新摩卡 DHT-PHEV当 AI 突然能 " 理解 " 自动驾驶
毫末能在这个时间点推出 DriveGPT" 雪湖 · 海若 ",显然不是简单 " 蹭热度 " 就能搞定的事情。
早在 2021 年,这家公司就开始研究 Transformer 大模型技术,现在显然受益于这种前瞻性判断。
毫末智行 CEO 顾维灏说,将把多个大模型的能力整合到 DriveGPT。
DriveGPT 有意思的一点在于,其通过引入人类驾驶数据建立 RLHF(人类反馈强化学习)技术,对自动驾驶的认知和决策模型进行持续优化。
这些术语看上去晦涩难懂,但大意就是,用人类在实际驾驶中应对问题的思路去训练自动驾驶算法。
再通俗一些,就是用一个老司机的驾驶经验,去对自动驾驶算法进行调优。
毫末 DriveGPT 雪湖 · 海若的另一个看点,就是人们期待看到类似 ChatGPT 那样的 " 突现 " 能力——就像一个人练功十年,突然打通了任督二脉一样。
官方资料显示,其参数规模达到 1200 亿,预训练阶段引入 4000 万公里量产车驾驶数据。
这是一种堪称庞大的参数规模,也为大模型潜在的 " 突现 " 能力提供了可能性。
" 突现 " 能力最让人着迷的是,其过程有点像机器人突然拥有了理解能力——实际上是大模型达到了一定规模后,突然出现的能够归纳上下文的能力。
这个过程会涌现大量 " 思维链 ",让大模型拥有推理能力——这种推理能力能够帮助大模型自主学习,并获得正确结果。
事实上,ChatGPT 也是通过不断迭代,完成了从量变到质变的 " 突现 ",并让人类大吃一惊。
毫末的参数规模目前是 1200 亿,是不是达到了 " 突现 " 能力的阈值尚无定论,也没法准确预测,但多肯定要好于少。
而且不要忘了一点——之所以能够搞到这么多数据,最大原因在于,毫末差不多是自动驾驶技术公司中商业化最为成功的玩家之一。
手里有钱,才能走的更远
在自动驾驶技术公司普遍面临商业化难题的背景下,毫末智行却不发愁赚钱。
根据官方说法,毫末是中国量产自动驾驶第一名。
毫末智行董事长张凯表示,搭载行泊一体功能的智驾产品将迎来前装量产潮,而毫末已经推出中国首款可大规模量产落地、重感知城市 NOH(城市领航辅助驾驶),并将首批落地北京、上海、保定等城市。
2024 年,毫末准备把这种产品落地 100 个城市。
值得一提的是,毫末的客户不仅来自与其有渊源的长城汽车,据称已经有 3 家主机厂签署定点合同。
在主机厂客户之外,其他商业模式也实现了落地。
比如随着 DriveGPT 雪湖 · 海若的对外开放,相当于为一些自动驾驶研究机构提供了一个基础设施,也因此又增加了一个赚钱路径。
包括北京交通大学计算机与信息技术学院、高通、英特尔等在内,已经成为这个大模型的第一批客户。
技术变现的另一个案例则是 DriveGPT 雪湖 · 海若的场景识别服务——标注 1 张图片的市场价是 5 块,但 DriveGPT 雪湖 · 海若只收 5 毛。
这也为其他自动驾驶技术公司开辟了新的商业化路径—— L4 级或更高级别的自动驾驶目前看起来还无法立即实现,但解决当前痛点可以让自己手中始终有钱可花。
【我们关注大出行、投融资,以及自动驾驶、动力电池等,欢迎交流,可添加微信 A10010A123】
本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。
关键词: