【导语】特斯拉再次引领自动驾驶技术革命,其最新车载芯片曝光,算力高达2500TOPS,刷新了车端自动驾驶芯片的算力纪录。这一速度远超行业共识,标志着自动驾驶技术正式进入“算力即能力”的(de)新(xīn)时(shí)代(dài)。从(cóng)10年(nián)前(qián)的(de)0.256TOPS到(dào)如(rú)今(jīn)的(de)2500TOPS,算(suàn)力(lì)万(wàn)倍(bèi)提(tí)升(shēng)的(de)背(bèi)后(hòu),是(shì)特(tè)斯(sī)拉(lā)对(duì)“第(dì)一(yī)性(xìng)原(yuán)理(lǐ)”的(de)笃(dǔ)信(xìn)与(yǔ)不(bù)懈(xiè)追(zhuī)求(qiú)。这(zhè)一(yī)变(biàn)革(gé)不(bù)仅(jǐn)将(jiāng)推(tuī)动(dòng)量(liàng)产(chǎn)辅(fǔ)助(zhù)驾(jià)驶(shǐ)技(jì)术(shù)的快速分化,还将为L3、L4级自动驾驶技术的发展带来新的可能。未来数年,数万TOPS的“超级AI汽车”或将成为现实,自动驾驶技术的上限远未触及。
10年10000倍!车端自动驾驶芯片的算力纪录,正在被这样的速度刷新。
2500TOPS,全部有效AI算力,来自始终笃信“第一性原理”的马斯克,和他的特斯拉,最新车载芯片曝光。
与其说“下一代”,不如说“领先一代”,因为2500TOPS的芯片被曝已成功流片,最快明年上车。
车端算力水平业内主流还是254TOPS,500-700TOPS只有头部玩家才有实力部署,极个别玩家算力堆到了1000TOPS以上。
特斯拉硬件性能的算力增长速率,远超当下行业共识和普遍节奏规律。
甚至10年前的马斯克自己,也很难料到。
算力10年涨10000倍,特斯拉最新车载芯片曝光
最新曝料,特斯拉下一代自动驾驶车端芯片,已经流片成功,进入批量生产的准备阶段。
3nm工艺,主要还是台积电代工,韩国的三星作为产能后备。
最重要的是算力——2000-2500TOPS之间。
消息是韩国每日经济新闻最先曝出的,这是韩国影响力最大的经济报刊,1966年军政府时(shí)期(qī)成(chéng)立(lì)(也(yě)是(shì)韩(hán)国(guó)各(gè)大(dà)财(cái)阀(fá)起(qǐ)家(jiā)创(chuàng)业(yè)时(shí)期(qī)),政(zhèng)治(zhì)立(lì)场(chǎng)保(bǎo)守(shǒu)偏(piān)右(yòu),而(ér)它(tā)背(bèi)后(hòu)的(de)财(cái)阀(fá)支(zhī)持(chí),也(yě)有(yǒu)三(sān)星(xīng)的(de)影(yǐng)子(zi)。
所(suǒ)以(yǐ)可(kě)以(yǐ)认(rèn)为(wèi)这(zhè)则(zé)曝(pù)料(liào)准(zhǔn)确(què)度(dù)很(hěn)高(gāo),北(běi)美(měi)的(de)媒(méi)体(tǐ)也(yě)广(guǎng)泛(fàn)引(yǐn)用(yòng)了(le)这(zhè)一(yī)消(xiāo)息(xi)。
2014年(nián)特(tè)斯(sī)拉(lā)首(shǒu)款(kuǎn)车(chē)Model S,搭(dā)载(zài)了(le)HW1.0硬(yìng)件(jiàn),底(dǐ)层(céng)采用(yòng)了(le)Mobileye的(de)EyeQ3芯(xīn)片(piàn),算(suàn)力(lì)0.256TOPS。
2014年(nián)5月(yuè)5月(yuè),一辆开启“Autopilot”的特斯拉与一辆大型拖车相撞,导致驾驶员死亡,这是自动驾驶历史上首例公开的死亡事故。随后,特斯拉迅速将核心算力从Mobileye更换为Nvidia的“Drive PX2”,算力24TOPS。
并且同步招募了硅谷半导体大师吉姆·凯勒(Jim Keller)以及曾在英特尔和苹果工作过的皮特·班农(Pete Bannon),开始自研自动驾驶芯片。
2019年HW 3.0发布,底层全部换装特斯拉自研产品,14nm工艺,单片算力72TOPS,板卡算力144TOPS。搭载在特斯拉绝对销量担当的Model 3 和ModelY上。
2023年特斯拉发布了HW4,5nm工艺,单片算力推测在200-300TOPS,车载平台算力超过了500TOPS。
也是从这一代硬件开始,特斯拉在北美完全抛弃了毫米波雷达及超声波雷达,走向更纯粹的视觉路线。
仅仅一年过后,新芯片算力已超2000TOPS,相比10年前的EyeQ3,已是10000倍的差距。
而马斯克不久前在财报会议上说,AI5整个套件算力会是HW4.0的十倍,由此推断真正上车时,AI5应该还是双芯片冗余,单颗算力至少2000TOPS+,整车算力4000TOPS以上。
这个水平远远超过目前L2+的主流算力配置。
国内玩家,比如大疆、比亚迪都已经验证,跑通一个端到端模型,其实并不需要泼天算力;甚至特斯拉自己,也在144TOPS的HW3.0方案上,OTA了最新的FSD版本。
技术客观,塑造了当下智能化竞(jìng)赛(sài)各个玩家的“装备配置”的基本思路。
只求实现高速NOA和泊车功能的,采用德州仪器数十TOPS芯片,或100TOPS左右(yòu)的(de)高通8650、8620足矣,通常见于缓慢转型的合资车,或强调性价比的国产A级小车。
这种算力条件下,其实也能强上“车位到车位”功能,只不过体验要做好难度极大(dà)。
用(yòng)户(hù)心(xīn)理(lǐ)层(céng)面(miàn)可(kě)用(yòng)敢(gǎn)用(yòng)的(de)城(chéng)市(shì)NOA能(néng)力(lì),通(tōng)常(cháng)至(zhì)少(shǎo)需(xū)要(yào)一(yī)块(kuài)英(yīng)伟(wěi)达(dá)Orin,256TOPS算(suàn)力(lì)。这(zhè)也(yě)是(shì)目(mù)前(qián)绝(jué)大(dà)多(duō)数(shù)“智(zhì)能(néng)普(pǔ)及(jí)”车(chē)型(xíng)采用(yòng)的(de)方(fāng)案(àn),可(kě)以(yǐ)说(shuō)是(shì)当(dāng)下(xià)成(chéng)本(běn)性(xìng)能(néng)最(zuì)平(píng)衡(héng)的(de)。
再(zài)进(jìn)一(yī)步(bù)要(yào)把(bǎ)“车(chē)位(wèi)到(dào)车(chē)位(wèi)”体(tǐ)验(yàn)做(zuò)的(de)足(zú)够(gòu)好(hǎo),接(jiē)管(guǎn)率(lǜ)足(zú)够(gòu)低(dī),就(jiù)需(xū)要(yào)两(liǎng)块(kuài)Orin的(de)算(suàn)力(lì)支(zhī)持(chí)。
但(dàn)多(duō)块(kuài)芯(xīn)片(piàn)之(zhī)间(jiān)的(de)通(tōng)信(xìn)、任(rèn)务(wu)分(fēn)配(pèi),并(bìng)行(xíng)计(jì)算(suàn)等(děng)等(děng)难(nán)度(dù)很(hěn)大(dà),要(yào)想(xiǎng)把(bǎ)VLA这(zhè)样(yàng)的(de)数(shù)十(shí)亿(yì)、百(bǎi)亿(yì)及(jí)参(cān)数(shù)模(mó)型(xíng)跑(pǎo)在(zài)车(chē)端(duān),就(jiù)必(bì)须(xū)要(yào)更(gèng)大算力芯片——700TOPS+的英伟达Thor在中国市场率先落地量产,正是自动驾驶技术体系的体现。
但这也就是现在量产辅助智驾的最高“装备等级”了。
小千TOPS算力下,VLA到底该怎么部署、算力到底是不够还是有余、是不是能完全利用……各家都在探索,还没有人能给出准确答案。
特斯拉把算力军备竞赛一下拔高到数千TOPS,真的有必要吗?
数千T,特斯拉怎么用?
英伟达Thor 2022年首次亮相时,老黄给的算力数据就是2000TOPS,震撼了整个车圈。
2025年量产上车的版本,包括理想、极氪,实际却是750TOPS算力的版本。
有传言说是吴新宙从小鹏到了英伟达后,劝老黄其实车端没必要这么大算力,成本也受不了。
所以海外媒体、用户对标特斯拉AI5的英伟达产品,不是Thor,反而是最新的5080、5090。
比如5080大约等效1800TOPS,5090则是 3,400 TOPS。
但这样的类比其实并不合理,因为特斯拉自从HW3.0开始,算力描述指的就是完完全全服务AI模型的有效算力。
也就是支持大规模乘加运算,并针对Transformer架构、算子做了特殊优化的NPU算力。
这也是通用GPU源流的英伟达芯片和车企自研自动驾驶芯片的根本不同。
资深从业者曾向智能车参考透露,包括Orin和Thor,整个芯片设计思路还是从传统显卡出发,尤其是Thor又要兼顾一部分座舱功能,包括了很多不同用途的模块,自动驾驶模型真正调用的有效算力,是达不到宣传数字的。
这也是为何特斯拉、小鹏、蔚来,以及Momenta等等自动驾驶玩家都要自研芯片的原因。
AI5的2000TOPS+算力,代表着超大参数模型可以上车。
特斯拉目前云端超算建成约30EFLOPS算力,在训练的云端基座模型据说参数已经超过500B,也就是5000亿参数,和领先的大模型玩家已经没有任何区别。
而从目前大模型技术出发推断,能用在驾驶任务的多模态大模型,也只有VLA。
流行的端到端实际参数量大约都是几十亿,同时还是“黑盒”,难以证明模型是真的理解路况,还是条件反射式的模仿。所以理论上限高,但很实际效果难控制,只能通过调整训练数据的分布来“间接”影响模型能力,下限依然需要规则兜底。
马斯克赌的,其实就是超大模型的“智能涌现”,让AI司机真正产生对环境场景的的认知理解能力,由此解决corner case。
云端多模态大模型具备基础能力后,在通过强化学习手段规范安全可靠性,然后通过知识蒸馏方法得到可在车端部署的较小模型。
当然车端的“小”模型是相对而言,整体规模仍然高出传统端到端,所以需要超大算力芯片。
另外从安全出发,依赖云端能力和即时通信的系统,安全隐患很大,车端部署完整模型也是必须。
同样的路线,特斯拉在走,国内的小鹏蔚来理想华为等等都在走,它们在一同推动自动驾驶领域的一场新革命:“算力即能力”。
对传统量产辅助驾驶,从今年开始会迅速分化成入门性价比的阵营,和超大算力高阶阵营。前者可能更多见于合资车或自主性价比入门车型,主打“有就可以,基本能用”,OTA潜力有限。
后者则有希望突破L2限制,在安全性、易用性、接管率上实现质变,即各家都在说的“L3”。
而对L4阵营,自动驾驶新的技术思路和话语体系出现,并且上路近在眼前,如果AI司机智能涌现真的被验证,沉寂多年的“升维降维”之争,又要被热烈讨论了。
甚至特斯拉的AI5、小鹏的图灵、蔚来的神玑等等仅仅是个开始:10年前没人能想到车端算力有万倍提升,未来数年,谁又能断言数万TOPS的“超级AI汽车”不会成为现实呢?
毕竟,大模型的上限还远未达到。
支付宝扫一扫
微信扫一扫