机器人行业专题研究从特斯拉人形机器人看智

(报告出品方/作者:国金证券,邵艺开,罗露)

1、下一代智能化终端,人形机器人将打开蓝海市场

1.1、特斯拉宣布进入人形机器人市场,技术可复用率高

特斯拉作为自动驾驶全球领先企业,已有技术积淀可在人形机器人中复用。公司宣布将于今年9月30日推出首款双足人形机器人-擎天柱(“OPTIMUS”),TeslaBot将基于视觉神经网络神经系统可预测性的自动管理技术,以DojoD1自研超级计算机芯片和提供算力的FSDChip2.0硬件驱动微核心。从目前公布的应用范围来看,人形机器人是服务机器人的技术升级,涉及自动控制、视觉导航、传感器技术等多种技术的融合。作为美国最大的电动汽车及新能源企业,公司具有领先行业的自动驾驶技术,部分技术积累可复用于人形机器人中,如:AI芯片、自动驾驶算法和AI视觉解决方案,但也有一些新增部分需要从相关元器件厂商处采购,比如减速器、伺服电机等上游材料。

自研D1芯片结合多芯片模块技术(MCM)构建高带宽、低延迟训练模块,支持全球最先进的可扩展AI训练机器Dojo系统。自定义计算芯片D1芯片是由个训练节点组成的阵列所形成的面积为平方毫米的计算平面,采用7nm制造工艺,热设计功率(TDP)为w。作为Dojo超级计算的集成单元,D1芯片能实现TFLOPS的机器学习计算(TFLOPs(BF16/CFP8)/22.6TFLOPs(FP32)),片上带宽为10TBps,边缘的IO带宽为4TBps,约为最先进的网络交换芯片的两倍。

训练模块由25个D1芯片使用扇出晶圆工艺紧密集成,保留了裸片之间的带宽,利用多芯片模块技术(MCM)解决IO问题,优化带宽,同时减少延迟、面积和功耗,实现相邻芯片间通信速度的低延迟。集成连接器、定制的电压调节器模块、机械和热部件的训练模块最终能提供9PFLOPS的计算和36TB/s的模块外带宽。个训练模块平铺创建出能够达到1.1EFLOPs的超级计算机系统,为AI训练提供充足算力。与行业中的其他类似超级计算技术相比,Dojo计算机在同等成本下具有4倍性能,1.3倍能耗节约,碳排放仅占1/5。它不仅能实现全球最快的AI训练速度,而且性能拓展无上限,特斯拉预计下一代Dojo系统在某些方面将拥有10倍的性能提升。

公司自动驾驶算法实现感知、规划与控制,赋能人形机器人部分类人特征。特斯拉自动驾驶方案基于感知网络输出根据真实世界建立的三维向量空间,并利用传统规划方法与神经算法相结合的混合规划系统,在该空间中规划汽车完成指定任务的行为和轨迹,最终控制其完成。特斯拉的神经网络算法(NeuralNetworks)应用前沿研究,训练深度神经网络处理从感知到规控的各种问题。预计该算法用于人形机器人中,将推进人形机器人的自治能力和对空间与时间信息的感知,并做出准确决策。由于拥有大规模原始数据集、自动标注方案、虚拟仿真空间以及充足的算力,特斯拉自动驾驶感知、规控的核心算法在应对不同场景的性能方面都可以得到充分的训练。

空间理解和短时记忆能力,实现特斯拉自动驾驶纯视觉感知。特斯拉放弃雷达融合方案,仅利用车身四周的八个摄像头模仿人类视觉系统原理进行纯视觉感知。采用HydraNet多头网络的基础结构形式,多个子任务共享特征空间。

感知网络将不同汽车摄像头捕捉到的视频数据经过数据校准层(Rectify)的处理和映射,消除外参后,通过残差神经网络(RegNet)和BiFPN多尺度特征融合结构,提取出多尺度视觉特征空间。采用“前融合”思路将多个视频数据融合后通过网络结构中引入的BEV(鸟瞰俯视图)空间转换层,其中的核心模块Transformer神经网络利用Query、Key和Value三个核心参数实现三维变换的空间理解,代替雷达感知物体深度信息。引入时空序列特征层识别不同时间维度的图像即视频片段,使自动驾驶感知网络拥有短时记忆能力。最后各个头部基于统一提取的时空特征序列可实现多个不同的任务,如物体检测、交通信号灯识别、车道线识别等。

完整的Autopilot神经网络包含48个网络,需要70,个GPU小时进行训练,共同在每个时间步输出1,个不同的张量(预测)。其中摄像头网络分析原始图像以执行语义分割、对象检测和单目深度估计。鸟瞰网络从所有摄像头获取视频,直接在自上而下的视图中输出道路布局、静态基础设施和3D对象。该视觉网络不仅能够利用仿真平台从世界上最复杂、最多样化的场景中学习,还能实时迭代地从特斯拉近万辆汽车组成的车队中获取信息。

特斯拉的仿人机器人在机器视觉上的路径和智能驾驶有相似之处。特斯拉机器视觉中的纯视觉解决方案,是基于图像的目标检测,目的是确定图象中是否存在给定类别的目标实例,若存在,就返回每个目标实例的空间位臵和覆盖范围。而目标检测就是解决分割、场景理解、目标追踪、图像描述、事件检测和活动识别等更复杂更高层次(时间记忆等)的视觉任务的基础。

谐波减速器是人形机器人的核心零部件,在国产替代趋势下相关供应商将有更多成长红利。根据特斯拉机器人目前公布的数据,20多个关节需要使用谐波减速器。但考虑到目前谐波减速器的单价较高,且技术壁垒高,特斯拉自研可能性很小,因此预计初期量产时谐波减速器的用量可能会有所减少。未来随着特斯拉机器人的量产和谐波减速器的降价,需求量将大幅增加。国内如绿地谐波、来福等优质厂商生产的谐波减速器的市占率明显提高,有望在人形机器人发展需求中进一步成长。

伺服系统市场规模近亿元,预计将在在工业自动化带动下保持高速增长及创新,可复用于人形机器人。伺服系统是一种电磁装臵,通过使用负反馈机制将电能转换为精确控制的运动。据中商产业研究院统计,-年,我国伺服系统规模将从97亿元增长到亿元,复合年增长率为23.3%,增速较快。长期来看,中国的人口红利会消退,劳动力成本会逐渐上升。传统行业尤其是制造业对自动化生产线设备的需求将始终保持增长趋势,且人形机器人作为新增场景,伺服系统的需求量将在未来有所增长,以及可能会有更先进的伺服系统产品出现。

人形机器人对控制系统的需求量以及高质量的要求,将进一步推进控制系统市场的发展。控制系统类似于机器人的大脑,负责向机器发出传感以及传递指令和一系列动作,控制机器人在工作过程中的运动位臵、姿态和轨迹。我国工业机器人产业链日趋成熟,在机器人控制器软硬件方面的发展实力不断增强,市场成倍增长。中商产业研究院数据显示,中国工业机器人控制器市场规模将从年的10.5亿元增长到年的14.7亿元,复合年增长率为8.8%。到年后中国工业机器人控制器市场规模将可能达到16.2亿元。

1.2、当前全球机器人市场竞争格局:欧美日领先,中国系统集成赶超

当代国际机器人市场商业模式:日本产业链,德国本体+集成,中美集成。根据产业链布局将商业模式归纳为三种:零部件、本体(包括本体+零部件、本体+集成、全产业链)、系统集成。美国模式侧重于系统集成,优势领域在医疗机器人、国防军工机器人,以AdeptTechnology、AmericanRobot为代表企业。欧洲模式以德国为代表侧重于本体+集成,在工业机器人和医疗机器人方面均具有产业优势,拥有以ABB、KUKA为代表的机器人国际公司。日本模式在零部件、本体、集成产业链上分工明确,优势领域在工业机器人和家庭机器人,著名企业包括发那科、安川等。中国在系统集成环节已反超外资,占据主要市场份额,正向日本德国模式发展,未来的发展趋势将类似于日本的产业链分工模式。

特斯拉虽然在智能汽车领域技术领先,但在人形机器人市场是新进入者。当前人形机器人领先企业波士顿动力与日本本田和特斯拉在产品定位与技术布局存在差异。从技术和产品成熟度来看,波士顿动力在行业中处于领先地位,专注于提升“运动智能”的能力,最开始是以军用机器人为出发点,属于专业领域,但还没有找到合适的商业化途径;日本本田尝试将ASIMO应用于教育、接待、娱乐等各类场景,并计划利用ASIMO驱动机构、控制算法等进一步研发具备看护、护理等功能的服务机器人。特斯拉则从家用、商用切入服务领域实现商业化。波士顿动力机器人应用场景主要在任务执行,产品迭代趋势为灵活性增加。

波士顿动力感知系统主要采用激光雷达解决方案,从四足改进到双足,体积、重量不断减小,速度更快,能实现的动作更多。日本本田在双足技术方面先发优势更为显著,经历了三四十年的双足、双臂技术积淀,平衡性与灵巧性不断提升。

特斯拉的双臂双足等协同技术仍缺乏沉淀。人形机器人的核心难点是双足技术,重心和动作的配合很重要。重心控制方面汽车到机器人跨度非常大,从高维向低维。另一核心难点双臂控制,行业总体还处于起步阶段,参考谷歌、三星、戴森等IT巨头,都采用单臂,控制难度较小。在工业方面,南方许多工厂使用机械臂代替人工进行高精尖工作,商业价值明确,但很难将技术移植到服务机器人上:因为机械臂在工厂里处于固定位臵,与目标点的距离固定。服务机器人有两条手臂,目标距离随时变化,对传感器精度、算法和目标跟踪提出了更高的要求,除了能准确捕捉目标外,更不能互相干扰。

波士顿动力的双足技术靠液压控制和算法可以实现通关、跑步、跳舞。日本本田2年推出了能够跳跃和使用楼梯的人形机器人ASIMO之后,人形机器人的发展方向逐渐走向成熟化。但他也用了很多模型去模拟人双足走。比双臂技术更难。现阶段AI技术水平也难以实现操作机器人做这类复杂的事情。但是波士顿动力和本田ASIMO的双臂没有那么灵活。手脚配合没有任何一家公司能做到。特斯拉也很难在Teslabot发布时有所超越。参考其他IT巨头,谷歌、三星、戴森。戴森的目标是年,谷歌没有透露原型成熟销售的时间,因为机器人,尤其是服务机器人,要突破很多技术难关。参照特斯拉智能汽车经验,马斯克擅长利用制造工艺与思维方式改变,在已有的技术基础上创造性实现成本和性能突破,9月30日TeslaBot或有意外惊喜。

1.3、人形机器人打开万亿蓝海市场

在“机器换人”的趋势下,机器人产业拥有广阔的市场空间。根据马斯克在年4月的TED演讲,Optimus的单价大约2.5万美元(约16.75万元人民币),显著低于波士顿机器人。预估Optimus单价在15万到20万元之间,有望进入家庭作业、快速配送、工业生产等各种消费级和商业级场景。据麦肯锡报告,到年,全球约有4亿个工作岗位将被自动化机器人取代,按20%渗透率测算全球人形机器人市场空间12-16万亿元。

根据IFR和中国电子学会的数据,年中国机器人市场规模预计约亿元,到年CAGR约为18.3%。其中,工业机器人、服务机器人和特种机器人市场规模分别为.7亿元/.6亿元/90.7亿元,占比分别为53%/36%/11%。尽管人形机器人处于起步阶段,参照其他电子产品,渗透率超过20%后将爆发式增长。按23-30年CAGR30%测算到年,我国人形机器人市场规模约亿元。

年中国人家工作10.68万元,按照Optimus15万-20万的价格区间,购买单台Optimus机器人的退货期为1.4-1.9年,即1-2年内可收回成本,机器人无需休息并且可以长时间从事高强度劳动。用机器人代替人力具有可预见的经济价值。

1.4、短期零部件先行,长期看机器人智能化程度空间广阔

根据产业链调研,机器人BOM成本主要集中在机身零部件,特别是电机、减速器,增量空间显著。以人形机器人关节为例,单个关节安装的位臵不同,承载力不同,价值差异大,总体区间可从几千到上万。机器人BOM成本约60%-70%投入各种机身关节、减速器、控制器等;主控芯片与全身传感器占比约15%;躯壳与电池等占20%。当前全球尚无实现商业化的人形机器人,使用场景与功能待定,不同技术解决方案成本构成差异非常大。8月12日晚小米发布人形机器人CyberOne(“铁大”),公告的BOM成本约60-80万人民币,比较符合当前市场认知。特斯拉机器人定价较低,预计三五年后可量产,降低硬件成本的技术方案,如谐波减速器,成为关键布局机会。

长期看机器人智能化程度提升增加对智能网联和AI算法需求的提升。机器人本体通信、连接入网,以及前期的数字孪生和算法训练,都将提升对芯片、通信模组、云计算资源的需求。同时,随着智能化程度提升,参考《中国汽车基础软件发展白皮书2.0》,汽车软件结构占比将从年的10%到年的30%,我们认为机器人软件占比也将复刻汽车软件发展路径,从当前约不到10%提升至年30%+。

2、下一代智能化终端,感知决策供应链与智能汽车或高度重叠

2.1、人形机器人环境感知需求高,带动各类传感器需求

人形机器人的环境感知方案或可类比智能汽车,利用摄像头、激光雷达、毫米波雷达、红外传感器、超声波传感器等。环境感知是对于环境的场景理解能力,例如障碍物的类型、道路标志及标线、行车车辆的检测、交通信息等数据的语言分类。环境感知需要通过传感器获取大量的周围环境信息,确保对车辆周围环境的正确理解,并基于此做出相应的规划和决策。同样地,人形机器人也需要感知系统判断周遭环境。由于各类环境感知传感器在感知性能上各有优劣,预计会搭配使用。

我们认为人形机器人感知能力应该对标自动驾驶L4以上级别:1)人形机器人作为家用机器人,在屋内活动时,需要清楚感知工作环境,避免造成人身伤害或经济损失;2)人形机器人或有外出任务,如:家庭采购、快递、外卖配送等,此时人形机器人在路上等同自动驾驶,需要具有判断往来车辆和行人以及路面标识的能力;3)人形机器人或将代替人类执行较危险的工作,如:高空作业、工地劳动等,因此需要具有感知精度更高、决策速更快的特性。

人形机器人感知方案或如同自动驾驶,分为纯视觉感知激光雷达与两大路线。纯视觉感知路线以机器视觉为核心,利用毫米波雷达+摄像头实现自动驾驶,其优势为成本低且符合人眼逻辑,在数据积累达到一定规模后能够超越激光雷达方案的表现,但在恶劣环境下,摄像头完成感知任务的难度也会随之提升;激光雷达方案可以在现有技术条件下实现快速3D建模,比较精准的还原路况信息,形成计算机可以快速识别、快速处理、快速应对的方案,目前的痛点在于成本高昂、且对芯片算力需求大。

特斯拉或坚持纯视觉路线,其他厂商可能采用激光雷达方案。特斯拉凭借自身的算法能力、数据储备等优势,采取基于摄像头的视觉方案;而国内车企通常选择基于激光雷达的技术方案。因此在人形机器人方面,特斯拉可能会坚持纯视觉路线,而在激光雷达产业链逐步成熟、成本逐渐降低的情况下,未来其他厂商制造机器人时,激光雷达或会成为主流方案。

人形机器人有望继智能汽车成为CIS最新增长动力。根据FrostSullivan,年至年,全球CIS出货量/全球车载CIS出货量的CAGR为13%/19%;全球CIS销售额/全球车载CIS销售额的CAGR为9%/21%,车载CIS销售额提升较出货量快的原因为车载摄像头需应对复杂的环境,因此标准更严苛,CIS作为其核心部件,需要提升HDR、LFM、低照等关键技术以匹配车载摄像头高像素、高稳定性的趋势,因此车载CIS的单位价值较高。同样地,人形机器人摄像头需要高性能快速且精确地取得图像信息,应对多变的工作环境,亦会使得此领域CIS价值量较高。

国内厂商发力高规格CIS,人形机器人CIS有望实现国产化。国内CIS行业起步较晚,以往主要从低端产品切入,而经过多年的追赶,与海外厂商差距正在不断缩小。根据ICVTank,年,国内厂商豪威科技(韦尔股份子公司)车载CIS市场份额达29%,全球排名第二,技术水平处于领先地位,产品广泛受到整车厂与Tier1厂商认可。而国内其他厂商也正发力车载CIS,例如格科微产品已用于行车记录仪、度环视、后视、座舱监控等;思特威产品在倒车摄像头后装市场获得广泛应用。由于国产CIS具备性价比、临近产业链与市场等优势,我们认为人形机器人是国产CIS的发展契机,推动国产厂商技术加速升级,占据更多市场份额。

豪威科技(韦尔股份子公司):国内CIS领先企业,有望凭借技术优势进入人形机器人产业链。豪威科技图像传感器产品已经广泛的应用于消费电子、安防、汽车、医疗、AR/VR等领域,其中CIS产品型号覆盖了8万像素至6,万像素等各种规格。可实现摄像头更高速的自动对焦;降低功耗并保障了图像质量;显著提升在无光和低光环境下的图像捕捉能力;能捕捉高速移动物体,且不会产生空间失真。目前豪威科技已打入国内多家自动驾驶产业链,未来或可凭借技术优势进军人形机器人产业链。

中国成为激光雷达主要市场,国产厂商占据地理优势。据FrostSullivan,-年全球激光雷达市场规模将以CAGR61%的增速增长,中国市场将占全球总市场的31.8%。激光雷达市场快速扩张主要受车载等高端应用领域拉升,由于车载环境感知的技术方案理论上可复用至人形机器人上,因此,一旦人形机器人需求起量,将带动激光雷达需求进一步扩张,国内厂商背靠市场,且上下游产业链完善,容易形成规模、成本优势。

国外激光雷达厂商仍占据车载较大份额,国内厂商正迎头赶上。国内激光雷达厂商发展迅速,目前技术已相对成熟,也已进入国内车企产业链,如:小鹏P5等使用大疆产品;小鹏G9、上汽智己L7、广汽埃安LXPlus等使用速腾聚创产品;北汽极狐αS、长城铁甲龙等使用华为产品。从市场竞争格局来看,据Yole统计,年全球车载激光雷达领域,法雷奥以28%的份额市场占有率第一;速腾聚创、禾赛科技、华为、大疆等国内厂商合计市场份额约为26%,单厂商市场份额较低,国产替代空间巨大。

速腾聚创:车规级MEMS激光雷达领导者。速腾聚创深耕MEMS微振镜技术路线,其RS-LiDARM1(MEMS)是全球首款车规级量产的MEMS激光雷达。年通过IATF车规认证,年批量出货北美,并于年领先全行业,实现车规级量产交付。性能方面,M1拥有°×25°的超广视场角以及最远m的测距能力,突破了nm光源MEMS激光雷达测距极限,并且实现人眼安全的激光级别。

禾赛科技:高线数激光雷达领先企业。公司拥有成熟且丰富的机械式激光雷达产品线(32/40/64/线)。其中PandarGT与速腾聚创RS-LiDARM1均为MEMS半固态产品。从最大扫描范围来看,PandarGT可达米(10%反射率),而RS-LiDAR-M1为米;从可视角度来看,RSLiDAR-M1的FOV为/25度,超过PandarGT的60/20度。

2.2、人形机器人算力要求较高,部分国产芯片厂商或可满足需求

人形机器人的控制芯片类似自动驾驶芯片。与智能驾驶相关的芯片主要分为自动驾驶芯片(边缘端)和智能座舱芯片两大类,另外衍生的相关芯片种类还有计算集群芯片(云端)。自动驾驶芯片具备智能和学习的特性,可模仿人的大脑神经网络,符合人形机器人需求,故可作为人形机器人的大脑。人形机器人注重机体运动的高流畅以及人机交互的低延时,需要更强大的算力支撑,才能使人形机器人更像人。

目前自动驾驶芯片市场份额主要由海外玩家占据,包括英伟达、英特尔Mobileye、高通等。国内外汽车自动驾驶进度上的差异,与国内外汽车AI芯片发展上有关。国外芯片产业发展时间长且产业链成熟,英伟达、高通、英特尔等国际巨头先后展开汽车智能化相关领域芯片的布局。国内芯片产业虽起步晚,但国内市场、政策提供了有利环境,AI芯片迎来发展风口,自动驾驶领域的AI芯片公司有望迎风见长。

国内厂商的核心优势在于国内市场庞大,可占据地利条件。虽然国内芯片在算力方面目前落后于英伟达等国际大厂,但随着时间推移,在技术水平跟上以后,产业链、终端市场等地理优势将逐步显现,本土化服务能力将成为国产企业核心竞争力,可持续


转载请注明:http://www.180woai.com/qfhqj/2224.html


冀ICP备2021022604号-10

当前时间: