(报告出品方/作者:西南证券,王湘杰,邓文鑫)
1、国产处理器领军者,CPU+DCU双轮驱动
1.1、自主高端处理器供应商,性能和生态优势明显
海光信息前身为天津海光,成立于年,由天津海泰科技投资、中科曙光和中科院等联合设立。公司采用Fabless经营模式,主要从事高端处理器、加速器等计算芯片产品和系统的研究、开发,产品包括海光通用处理器(CPU)和海光协处理器(DCU)。海光处理器以“性能强劲、安全可信、完善生态”作为主打标签,兼容市场主流的x86指令集,具有成熟而丰富的应用生态环境,多款产品性能达到国际同类型主流高端处理器水平,在电信、金融、互联网、交通、能源、中小企业等下游领域得到广泛应用。
国资背景强大提供资源支持,员工持股平台覆盖范围广。公司前十大股东中,有五家均为国有法人控股。年,中科曙光受让海光信息亿股股权,成为海光信息第一大股东,上市前持股比例为32.1%;结合中科曙光在计算产业的深度布局和产业资源,与海光信息形成良好业务协同,助力公司高质发展。当前公司无实际控制人,并且各股东承诺在上市之日起36个月内不谋求获得或参与争夺公司控制权,预计公司股权和控制结构将保持相对稳定。此外,蓝海轻舟合伙为公司员工持股平台,当前持股比例为6.09%,激励对象包括名公司高管、核心技术人员和其他员工,覆盖范围较广,实现核心员工利益绑定。
与AMD成立合资子公司,开启自主研发之路。年,海光信息与超微半导体(AMD)达成合作,共同成立海光微电子与海光集成两家子公司,引入x86和Zen微架构等高端处理器的技术授权及相关技术支持。其中,海光微电子主要负责x86处理器核(core)开发以及芯片的生产、封装、测试等外协工作,是海光集成的生产成本中心;海光集成则主要负责处理器系统架构设计、IP核开发,以及产品的推广和销售。公司与AMD签署的《技术许可协议》中,明确约定海光可在中国以服务器和工作站的用途销售、进出口、分销合资产品,并且该许可在两家合资公司运营期限内持续有效。同时,在年公司被列入美国“实体清单”后,AMD不再提供相关技术服务,公司自行实现了后续产品和技术的迭代开发,双方技术路径已产生差异,尚未出现相关知识产权方面的纠纷。
核心团队技术+产业背景深厚,技术创新与落地推广并重。高端处理器设计属于技术密集型行业,公司骨干研发人员多拥有intel、AMD等国内外知名芯片公司的就职背景,以及成功研发x86处理器或ARM处理器的经验,是公司核心竞争力不断提升的基石。截至年底,公司拥有研发技术人员人,占员工总人数比为90.2%,其中拥有硕士及以上学历人员,占员工总人数的65.53%,技术实力国内领先。同时,公司管理层拥有丰富的产业背景和资源,亦在内部管理、供应链、产品销售等方面组建起成熟团队,助力公司产品走向市场并快速推广。
1.2、CPU+DCU协同布局,产品持续迭代
公司集中发力高端处理器,研发量产海光CPU和海光DCU。公司是国内为数不多掌握了高端处理器核心微结构设计、高端处理SoC架构设计、处理器安全、处理器验证、高主频与低功耗处理器实现、高端芯片IP设计、先进工艺物理设计、先进封装设计、基础软件等关键技术的民族企业。根据应用领域、技术路线和产品特征的不同,公司形成CPU和DCU两条主要的产品线。
海光CPU:主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流x86处理器架构和技术路线,具有先进的工艺制程、优异的系统架构、丰富的软硬件生态等优势;并且支持国密算法,扩充安全指令,集成安全算法专用加速电路,支持可信计算,大幅度提升高端处理器的安全性。面向不同的市场需求,公司CPU产品已形成、、三大系列,面向高、中、低端市场进行全方位覆盖:1)海光系列主要应用于高端服务器,面向数据中心、云计算等复杂应用领域;2)海光系列主要面向政务、企业和教育领域的信息化建设中的中低端服务器需求,并发处理能力和单核心处理器性能较为均衡;3)海光系列主要应用于工作站和边缘计算服务器,面向入门级计算领域。
海光DCU:属于GPGPU的一种,构成与CPU类似,结构逻辑相对CPU简单但计算单元数量较多。海光DCU协处理器全面兼容ROCmGPU计算生态,和NVIDIA的CUDA通用并行计算架构具有高度相似性,CUDA用户可以以较低成本快速迁移至ROCm平台。因此,海光DCU可较好适配国际主流商业计算软件和人工智能软件,软硬件生态丰富,能够广泛应用于大数据处理、人工智能、商业计算等计算密集类应用领域,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。
获得国内主流OEM支持,产业链生态迅速拓展。公司产品支持能够适配主流的x86、Linux操作系统,支持多个版本的数据库、中间件、AI算法、云计算平台等,迁移成本较低。凭借优异的软硬件生态与性能,公司逐步开拓了浪潮、联想、新华三、同方等国内知名服务器厂商,有效地推动海光高端处理器的产业化落地;同时,海康威视、清华同方和锐捷等厂商基于海光CPU推出工作站,主要应用在工业设计和应用、图形图像处理等场景,市场空间进一步打开。
1.3、进入收获期,业绩爆发正当时
营收持续高增长,年实现转亏为盈。1)收入端:-年,公司产品得到市场广泛认可,分别实现收入3.8亿元、10.2亿元、23.1亿元,CAGR高达.9%。2)利润端:年之前公司连续亏损,主要由于集成电路设计前期需投入大量的研发资金,以及前期实施了较大力度的员工激励所致。年,伴随公司收入规模的扩大和费用投入的稳态化,公司完成扭亏转盈,实现归母净利润3.3亿元,同比增长.6%。
爆发增速持续,年上半年业绩表现已超年全年。年H1,伴随电信、金融等领域的行业领域持续推进,叠加DCU产品的进一步放量,公司实现营业收入25.3亿元,同比增长.8%;实现归母净利润4.8亿元,同比增长.8%。同时,根据公司招股说明书,年前三季度预计实现收入36.7-40.8亿元,同比增长%-%;预计实现归母净利润6.1-7.0亿元,同比增长%-%,爆发增速延续,全年业绩高增值得期待。分产品看,系列CPU贡献主要营收,DCU快速放量。年公司CPU产品整体实现营收20.7亿元,同比增长.7%,收入占比达到89.7%;其中系列CPU实现收入15.0亿元,贡献收入占比达到65%。同时,公司DCU产品于年下半年正式量产出货,一经上市反响优异。年DCU实现营收2.4亿元,收入占比达到10.3%。
产品单价代际上涨,并随产品生命周期的推移逐步下降。年6月以前,公司产品销售规模较小,主要采用参照国际同行业领先企业的产品价目表的定价方式;年7月以后,公司开始采用行业通用的阶梯定价策略,接受针对项目的单独特价申请。总体来看,公司对新代际产品较上一代产品定价有所上涨,而某一代际产品上市初期定价较高,后续随生命周期的推移逐步下降。分行业看,电信和金融收入占比前二,多领域持续推进。公司在电信运营商、金融等领域市场份额持续提升,年分别实现营收3.8/2.6亿元,同比增长.4%/.0%,占比分别达到20.5%/14.0%。此外,伴随公司产品线逐步丰富、市场开拓力度加大,在互联网、教育、交通等重要行业的销量亦快速提升,营收结构持续优化。
CPU毛利率不断提升,DCU产品放量后规模效应值得期待。伴随产品放量后规模效应的逐步显现,公司综合毛利率大幅提升,年公司综合毛利率达到56.0%,相较年提升18.64pp。分产品看,年CPU产品毛利率为56.0%,DCU产品毛利率为34.8%,我们认为主要是由于DCU产品量产上市时间较短,销量规模难以企及CPU产品,预计随着DCU产品逐步放量,规模效应将使得其单位成本下降,DCU产品毛利率提升值得期待。
持续高研发投入保证新品迭代速度。高端处理器产品迭代速度快,需要持续投入研发保持核心竞争力,稳固市场地位。公司研发支出绝对值逐年增加,但研发费用率逐年下降,年公司研发费用7.5亿元,研发费用率为32.2%;H1公司研发费用为7.0亿元,研发费用率为27.5%。此外,公司研发支出资本化率较高,形成的自研无形资产金额较大,-年资本化率分别为79.7%/51.2%/53.0%。费用率不断降低,公司步入收获期。-年,业务扩张及效率提升带动销售费用率和管理费用率逐年下降,财务费用率保持较低水平。H1,公司销售费用率、管理费用率、财务费用率分别为1.4%(-2.59pp)、2.5%(-5.10pp)、-0.1%(+0.65pp)。综合看,公司已由前期的高投入阶段步入业绩兑现的收获期,盈利能力不断提升。
2、自主可控势在必行,国产处理器空间广阔
2.1、我国集成电路高速发展,重心向高端设计制造转移
我国集成电路高速发展,增速远超全球。集成电路行业作为全球信息产业的的基础,市场规模保持稳定增长。根据世界半导体贸易统计组织(WSTS)的数据,全球集成电路的规模由年的亿美元增长至年的亿美元,CAGR为5.3%。我国集成电路虽然起步较晚,但年以来,随着我国居民消费能力提升,对集成电路产品的需求强劲,市场重心开始向国内转移。年,我国集成电路市场规模达到亿元,-年CAGR达到19.7%,接近全球增速的近4倍。受益于人工智能、大数据、5G等技术的成熟和产品的普及,预计我国集成电路产业将在未来继续保持快速增长趋势。
产业结构升级,重心向高端设计制造转移。纵观全球竞争格局,集成电路设计位于产业链上游环节,对技术研发实力要求极高,具有产品附加值高,细分门类众多等特点,企业的头部效应尤为明显,高通、英特尔、博通、英伟达等少数几家企业长期占据市场大部分份额。目前全球集成电路设计仍以美国为主导,市占率达到55%;随后依次是韩国公司21%,欧洲公司7%,中国台湾地区公司6%,日本公司6%;中国大陆地区公司市占率仅为5%,虽是全球重要的参与者之一,但话语权仍然较弱。
自年以来,我国集成电路设计企业数量逐年增加,并逐步进入到全球市场的主流竞争格局中;截至年底,我国集成电路设计企业达到家,-年CAGR为19.6%,其中销售额过亿的企业为家,市场集中度还较低,处于百花齐放的发展初期。分解来看:年,我国集成电路设计产业销售收入.4亿元,同比增长23.3%,所占比重从年的32.2%增加到42.7%;芯片制造销售收入.1亿元,同比增长19.1%,所占比重从年的24.0%增加到28.9%;封装测试业销售收入.5亿元,同比增长6.8%,所占比重从年的43.8%降低到28.4%。芯片设计产业规模占比逐年攀升,象征着我国集成电路产业逐渐从低端走向高端,产业发展也呈现高速且高质的特征。
2.2、服务器长期需求强劲,处理器占据价值高地
服务器市场发展呈现一定周期性,算力需求仍可看长。过去十余年,伴随移动互联网和云计算的兴起,服务器行业整体保持稳健增长。根据IDC数据,-年,全球服务器出货量从万台增长至万台,CAGR为5.7%;销售规模由亿美元扩大至亿美元,CAGR达到10.0%。虽然期间受全球互联网行业CAPEX收缩和疫情等多因素影响,行业呈现存在一定景气周期波动,但我们认为,随着更多的经济及社会活动由线下转移至线上,对于数据存储及运算能力提出了更高要求,长期看服务器市场需求将维持增长态势。
处理器为服务器的大脑,占据价值高地。服务器是一种高性能计算机,逻辑结构仍然遵循冯·诺依曼架构,主要由处理器(CPU、GPU、DPU等)、存储器、I/O接口,以及SSD、BMC、PCIe插槽、主板、电源、风扇和相关软件等部分构成。其中,处理器在服务器中承担“大脑”的角色,对服务器的整体性能发挥有着决定性的作用。根据IDC,以经典x86服务器E5高配为例,CPU成本在基础型服务器中约占32%;在更高高性能的服务器中,处理器相关成本占比高达50%-83%。
2.2.1、CPU:x86仍是主流架构,性能和生态优势明显
中央处理器(CPU)是计算机的运算和控制核心。CPU用于解释计算机指令和处理计算机软件中的数据,并负责控制、调配计算机的所有软硬件资源。CPU的内部结构大致可分为控制器、运算器、寄存器三大单元,其中还包括高速实现缓冲处理器之间联系的数据、控制的总线;控制单元从存储单元中获取可执行的代码,通过指令译码将其转换为可执行的指令,进而运算单元基于获取的指令对存储单元中的数据进行运算。
按照设计思路的不同,CPU可分为复杂指令集(CISC)架构和精简指令集(RISC)架构。计算机系统中所有软件层的操作,最终都将通过指令集映射为CPU的操作。1)CISC(ComplexInstructionSetComputer):一条指令完成一个复杂的基本功能。单条指令集功能强,指令类型丰富完善,编译后指令数量较少,通用场景下性能具有优势;以x86架构为代表,主要用于桌面PC及服务器领域,配套软硬件丰富完善。2)RISC(ReducedInstructionSetComputer):一条指令完成一个基本动作,多条指令组合完成一个复杂的基本功能。指令集架构在不断完善,译码效率高,偏向低功耗领域优化;以ARM架构为代表,过去主要用于手机、平板等移动终端,软硬件生态逐步建设完善。
服务器领域x86架构仍是绝对主流,销量占比超过97%。Microsoft和Intel两家企业凭借自身规模效应和技术优势,在上世纪80年代结成了Wintel技术联盟,自此开始主导全球的PC和服务器市场。双方基于x86架构的CPU和Windows操作系统优化各类软件应用,使得x86处理器的生态环境较其他架构处理器具备明显的先发优势。根据IDC数据,近年来x86服务器的销售额占比几乎一直维持在90%以上,销量占比更是保持97%以上,仍然占据主要市场份额。
2.2.2、GPGPU:算力需求多样化,市场迅速扩容
通用图像处理器(GPGPU)是GPU的一种技术分支。传统意义上的GPU专门用于图形图像处理,内置了视频编解码加速引擎、2D加速引擎、3D加速引擎、图像渲染等专用运算模块;GPGPU作为运算协处理器,针对不同应用领域的需求,增加了专用向量、张量、矩阵运算指令,提升了浮点运算的精度和性能,以满足不同计算场景的需要。
GPGPU广泛应用于商业计算、大数据处理、AI等领域。GPGPU的构成相对简单,内部包括大量的运算单元核心和超长的流水线,具有处理并行计算任务的优势,尤其擅长大量类型统一的数据运算。随着GPGPU的技术发展和相关生态环境的逐步完善,其用途被进一步发掘,目前已经广泛用于商业计算、大数据、人工智能等领域。其中,GPGPU是人工智能领域最主要的协处理器解决方案,占据人工智能90%以上的市场份额,使用GPGPU在云端运行模型训练算法,可以显著缩短海量训练数据的训练时长,减少能源消耗,从而进一步降低人工智能的应用成本;同时,GPGPU能够提供完善的软件生态系统,便于各种已有应用程序的移植和新算法的开发,在无人驾驶、智慧工厂、智慧城市等应用场景具有广泛的市场空间。
人工智能与数据中心高速发展,支撑GPGPU市场快速扩容。人工智能是全球IT产业发展最快的新兴技术应用之一,在人工智能发展的三要素中,无论是数据还是算法,都离不开算力的支撑。年,深度学习模型对算力的需求已达到了每天百亿亿次的计算需求。目前先进模型的参数量和复杂程度正呈现指数级的增长趋势,人工智能所需算力每四个月即翻一倍,AI算力已成为驱动人工智能发展的核心动力,而承载AI的新型算力基础设施的供给水平,是直接影响AI创新迭代及产业AI应用落地的关键因素。目前,全球AI服务器占AI基础设施市场的84.2%以上,是AI基础设施的主体。根据IDC,未来AI服务器将保持高速增长,预计在年全球市场规模将达到亿美元。同时,伴随AI对算力要求的提升,服务器搭载的GPGPU芯片数量有望逐年提升,有望进一步支撑GPGPU快速发展。
此外,从数据中心的角度来看,全球范围内云数据中心、超级数据中心的建设速度不断加快,全球范围内数据中心对于计算加速硬件的需求不断上升。参照GPGPU领域龙头企业NVIDIA的数据中心业务,其收入规模从年的的3.4亿美元增长至亿美元,复合增速达到77.4%,远超其他板块业务的增速水平,进一步验证了下游数据增长对泛人工智能芯片的旺盛需求。
2.3、供需两端同频共振,国产处理器腾飞正当时
国产处理器发展几经波折,当前步入全面加速阶段。我国对于处理器的研究可以追溯至上世纪50年代,彼时与国际先进水平基本处于同一起跑线,但主要在80年代被海外拉开了较大差距,国际龙头公司抓住处理器商业化的契机建立起规模效应和生态技术壁垒。进入21世纪后,在一系列的政策加持下,我国处理器产业重新开启追赶之路;而历经多年的探索和试点应用,当前国产处理器产业已经初具规模,在多领域均出现了一批领军企业,率领产业走向加速发展阶段。
起步阶段(s-s):年,半导体科技被列为国家新技术四大紧急措施之一。此后,中科院计算所、厂、半导体所先后成立,半导体器件相继取得突破。年,我国第一台集成电路百万次计算机研制成功,彼时与国际先进水平相差不大。迎来低谷(s-s):CPU开始进入市场化商用阶段,“Wintel”联盟组建并火速攻占全球市场,但与此同时我国的半导体产业政策支持力度明显下滑,国产CPU研制进度陷入停滞,与海外差距开始拉大。
重新启航(0s-s):自主可控问题再次提上国家议程,“十五”期间,国家启动发展国产CPU的泰山计划及计划,产业政策开始不断加码。2年,我国首款通用CPU龙芯1号流片成功;6年,“核高基”重大专项推出;年,我国发布《国家集成电路产业发展推动纲要》,国家集成电路产业投资基金(简称国家大基金)第1期成立,主要投资集成电路制造企业。政策和资金倾斜下,国产CPU开始步入正轨,提速追赶。
加速腾飞(s-至今):历经数十年的艰辛探索,国产CPU产业已经初具规模。以鲲鹏、海光、飞腾、龙芯、兆芯、申威为代表的六大国产CPU领军企业在设计能力上已逐步接近全球领先水平,与此同时软件生态正逐步完善。巨大的下游市场配合积极的国家政策,叠加国际形势催生国产替代的紧迫性,国产CPU产业乘风而上,正式进入高质腾飞阶段。
系列政策倾斜加持,国产技术加速突破。集成电路是典型的人才密集型和资金密集型产业,复盘我国处理器的发展历程,产业的加速度与政策支持力度息息相关。在国际形势日益严峻的大背景下,我国对国产处理器的支持力度逐步加大。年8月,国务院印发《新时代促进集成电路产业和软件产业高质量发展的若干政策》,明确集成电路产业的核心战略地位,从财税、投融资、研究开发、进出口、人才等全方位支持集成电路产业发展;同时,《“十四五”规划》中亦明确提出利用举国体制,攻克人工智能、集成电路等前沿技术,实现科技强国战略。我们认为,鲜明的时代背景和良好的政策环境下,国产处理器技术有望持续突破。
数字经济战略定调,底层新基建率先受益。年,中央经济工作集会首次提出“新型基础设施”概念;年,国家多次部署“新基建”相关任务,确定5G基站、大数据中心、人工智能、工业互联网等七大领域;年,《“十四五”数字经济发展规划》顶层设计出台,首次将数字经济地位提升至国家战略层面,紧随其来的重要文章《不断做强做优做大我国数字经济》进一步强调加快新型基础设施建设。
东数西算工程启动,拉动后续采购需求。年2月,国家发改委等部门联合引发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群,其中大部分枢纽省市原本已对数据中心做出积极规划,中西部省市规划相对积极,例如成渝机架数量在“十四五”期间翻5倍,内蒙古翻3倍,宁夏翻24倍。我们认为,“东数西算”正式全面启动,是数字经济战略的重要落子,将进一步强化相关落地,有望带动后续服务器采购需求。
数据处理需求爆发,市场扩容趋势明朗。我国年数据中心机架达到万架,年机架数超过万架;截止目前,我国机架规模已达万架,算力达到EFLOPS,CAGR超过32%。我们认为,传统产业的数字化转型将是未来长期的发展主线,以云计算为代表的底层IT基础设施则是核心之一;根据IDC,云平台建设的硬件成本中,服务器所占比重最大,达到75%左右。伴随5G逐步商用,物联网、智能汽车等新场景的加速落地,海量数据运算和存储的需求将快速增长,叠加数据中心等新基建建设要求,相关主体有望开展新一轮的设备采购计划,中国服务器整体空间扩容的趋势明朗。
形势所迫,国产化进程加快。长期以来,我国对海外IT产品的依赖度较高,以Intel、Microsoft、Oracle、Cisco等为代表的IT厂商在芯片、操作系统、数据库、中间件等领域占领了较大市场份额,高度渗透了政府、金融、民航、铁路、医疗等各行业环节。自8年以来,由海外产品引发的信息安全事件频出,IT技术的自主可控势在必行。年,中兴、华为被纳入“实体清单”,成为信创产业真正进入爆发阶段的导火索,我国第三次“整芯铸魂”信创浪潮正式开启,整个产业的核心是芯片与操作系统,发展逻辑是围绕CPU和操作系统打造国产生态体系。而年以来,伴随俄乌冲突的加剧,以及近期美国通过《芯片与科学法案》等事件刺激,信息创新的短期紧迫性和长期确定性再次得到加强,关键技术领域的国产化进程有望加快。
国产处理器多点开花,协同推动产业繁荣。从供给角度看,我国CPU企业历经多年的研发迭代和推广验证,已经初步形成“三大技术路径,六大国产龙头”的市场格局,并带动产业链上层应用软件的聚集效应开始显现。基于指令集架构的不同,当前国产CPU厂商主要分为三大类型:1)基于x86架构的兆芯、海光:性能起点较高,生态迁移难度小,替换空间大;对于性能要求较高,需要平滑迁移的领域具备显著优势。2)基于ARM架构的飞腾、鲲鹏:架构迭代空间广阔,性能提升较快,生态适配较好;基于ARM架构的PC和服务器CPU近年来发展迅速,亦是符合国际主流技术路径的方向之一。3)基于自研指令集的龙芯、申威:全栈自研,自主可控程度极高,在当前紧迫性和必要性进一步提升的背景下,有望加速迭代、扩展生态,迎来重大发展机遇。
由于不同终端场景对于CPU的性能、生态、安全性考量并不相同,各家龙头企业基于不同的指令集架构,自主探索出了符合自身发展的最佳路径,在信创的不同细分领域引领生态变革,共同推动产业繁荣。
3、性能强劲生态领先,深度受益信创加速
3.1、持续吸收迭代,从追赶者到并驾齐驱
取之所长,性能起点高。年,海光信息与超微半导体(AMD)达成合作,共同成立海光微电子与海光集成两家子公司,引入Zen1微架构等高端处理器的技术授权及相关技术支持。Zen架构相较AMD过去的芯片设计有着质的飞跃,加入了微指令缓存,整型/浮点指令调度器从48/60个增加至84/96个,IPC(每时钟周期指令数)性能提高52%,补上了核心短板;同时Zen1进行了缓存层级的彻底重构,引入同步多线程(SMT)能力,制程工艺由28nm/32nm升级至14nmFinFET,在性能和功耗上进行了双重升级。从时间节点上,彼时Intel正好陷入10nm接连推迟,“Tick-Tock”发展模式失效的低谷期,Zen架构的发布吹响AMD反击的号角;根据PassMark数据,自年后AMDCPU市场份额快速提升,最高在年达到40%,其中服务器CPU最高达到10%,侧面映证Zen架构的优势。
消化吸收,自主创新。公司引进Zen架构后,秉承“销售一代、验证一代、研发一代”的产品研发策略,不断进行技术创新。1)海光一号产品设计时,公司重点对引进技术进行“消化吸收”,主要基于AMD交付的源代码进行研发,同时进行了部分自主创新,包括基于中国密码算法的安全增强技术等。通过海光一号CPU的研发和产业化,公司建立了高性能通用处理器设计方法学、研发流程、产品工程技术体系等,建立了一支具有国际主流CPU研发经验的设计团队,为海光CPU后续产品的生产研发奠定了基础。
2)海光二号CPU在海光一号CPU成功研发的基础上,对CPU处理器核心的微体系结构进行了较大程度的自主创新,尤其是年公司进入实体名单后,AMD不再提供技术支持,公司开始全面掌握通用处理器的设计技术,并完成了规模化应用验证。3)从海光三号处理器开始,公司独立开展通用处理器的迭代开发,在微体系结构上进一步自主创新:优化取指单元中的分支预测器,实现了更精确的分支预测算法和更高的预测带宽;优化PCIe控制器,将带宽从8Gbps升级到16Gbps;优化内存控制器,将内存频率从MHz提升到3MHz,增加内存读写错误时的重传机制,提升服务器系统的RAS能力;优化片上网络,提升带宽,修改内部通信协议,提升工作频率等。海光三号CPU于年6月发布,现已经开始量产,即将进行规模化销售。
产品性能比肩国际,处于国内领先地位。处理器重要的性能指标包括指令集、主频、核心数、内存通道等,从当前的主力出货型号海光二号CPU性能来看,公司产品性能达到了国际上同类型主流高端处理器的水平,对标Zen2架构下的AMD第二代EPYC产品,海光产品整数和浮点性能大约在AMD的80%-90%之间;对标Intel同期发布的至强铂金系列产品,浮点运算能力更为接近,总体性能逼近国际同代际主流技术水平。同国内的主流CPU相比,不同指令集架构下部分产品参数如核心数、超线程对产品性能影响程度不同,仅具有参考意义,并且核心数的增加也会限制主频的提高。总体来看,公司采用x86指令集,在性能和生态方面的起点较高,并且在PCIe通道数,内存通道数等相关I/O性能方面也达到领先水平。
DCU一号产品性能同样接近国际水平,DCU二号研发进度顺利。海光DCU产品采用最新的7nmFinFET工艺,基于大规模并行计算微结构进行设计,不但具备强大的双精度浮点计算能力,同时在单精度、半精度、整型计算方面表现同样优异,是国内唯一同时支持全精度和半精度训练的加速计算芯片。若选取国际主流的NVIDIAAmpere和AMDMI进行对比,NVIDIA作为GPU领域的绝对龙头,其产品在内核频率、显存以及TDP功率上均仍然处于领先地位,但在典型应用场景下,公司深算一号指标已较接近国际主流产品水平。公司在DCU产品系列同样持续进行迭代,深算二号DCU在深算一号DCU成功研发的基础上,对DCU计算单元的微体系结构进行了较多自主创新:增加计算单元的规模,改进片上网络协议,优化访存子系统等,预计新一代产品性能大幅提升。
3.2、生态壁垒高筑,原生安全基因
指令集是生态的源头。指令集是一套控制计算机系统运行的最小功能单位和标准规范,相应的CPU设计、软件编写均需要针对指令集架构进行优化,才能发挥出最佳性能。因此,指令集是计算机生态的源头,在此之上的芯片、操作系统、基础软件、应用软件等生态圈层都围绕着指令集建立。x86架构是Intel于年推出的指令集,以强大的性能为标签,协同Microsoft组建起“Wintel”联盟,吸引主流软件厂商在此基础上进行开发与优化,一步步建立起庞大的生态体系,牢牢把持着服务器、PC等终端市场的主要份额。
x86指令集带来天然生态优势,软件迁移成本低。回顾x86架构40余年的发展,期间挫败了PowerPC等竞争对手的数次冲击,当前也正面临着ARM的挑战。伴随CISC与RISC的融合发展,从性能、功耗等角度出发,ARM在PC和服务器等市场的确拥有替代x86的可能性,但真正横在PowerPC和ARM等一众挑战者面前的仍然是x86体系高筑的生态壁垒,短期内难以被打破。海光信息基于x86架构进行CPU的开发与迭代,天然继承了Wintel生态的兼容性优势,上层软件迁移的研发成本和时间成本较其他指令集架构更低,在推广和放量节奏方面有望显著受益。
CUDA是英伟达称霸GPU领域的关键因素。CUDA是NVIDIA在6年推出的一种并行计算平台和编程模型,包含CUDA指令集架构和GPU内部的计算引擎,以及编译器、调试器、开发库、运行环境和驱动等全套工具包,是一种完整的GPU解决方案,可大幅提升GPU的计算性能。
自CUDA推出以来,英伟达在将GPU转化为更通用的计算工具方面持续高额投入,使之全面支持C语言等标准编程语言以及OpenCL等API接口,并且将硬件支持下沉至千元游戏卡Geforce,以此吸引了大量的开发者和世界领先企业的加入,构筑起依托于CUDA软件栈之上的第三方应用与工具链生态壁垒。更为重要的是,英伟达开源了Cub、NCCL、Nvcaffe等通用场景下的开发库,尤其是深度学习成为主流之后,英伟达有针对性地对软件拓展和芯片架构进行协同设计调优,在通用性和效率上获得了很好的平衡,使得GPU和CUDA被AI从业者视为标配选择。当前绝大部分的深度学习训练和推理框架都把对于英伟达GPU的支持和优化作为目标,形成了自我加强的生态正循环。
海光DCU兼容“类CUDA”环境,完善软件栈支持计算密集型应用。ROCplatforM是一种由AMD公司推出的、基于一系列开源项目的AMDGPU计算生态,和CUDA在生态、编程环境等方面具有高度的相似性。海光DCU全面兼容ROCm的计算生态,提供层次化软件栈,原生支持常见计算框架(Tensorflow、Pytorch等)、软件库和编程模型,并适配不同API接口和编译器。因此,当移植国际主流的商业计算软件和AI应用软件进行推理和训练时,通常只需要API迁移,便可直接调整现有的GPU训练命令和参数,公司通过参与开源软件项目,加快产品推广速度。
产业多方合作,逐步做大做深“朋友圈”。1)与国内头部的AI企业科大讯飞、商汤、云从等达成密切合作,已有大量的模型移植并运行在海光DCU平台上;2)与阿里、百度等互联网大厂推出联合方案,打造全国产软硬一体全栈AI基础设施,目前已得到PaddlePaddle认证,成为唯一完全支持训练/推理的国产AI加速卡;3)深度参与“东数西算”先进计算中心、“新基建”智算中心的建设,与大股东中科曙光深入协同,打造国产算力底座。
发起光合组织,进一步完善国产生态。公司作为发起人单位,成立海光产业生态合作组织,围绕国产通用计算平台,联合产业链上下游企业、高校、科研院所、行业企业等相关创新力量,实现关键共性技术协同攻关,从芯片层对软硬件系统进行深度优化,共同打造安全、好用、开放的产品与解决方案,并开展测试认证、技术培训、方案孵化、应用示范、推广交流等系列活动,促进合作组织成员的共同发展,共建包容、繁荣的信息技术生态系统。历经两年的发展,光合组织已有成员单位0+,适配认证厂商+,产品适配认证0+,区域分会10个,适配中心15个,生态圈层正不断壮大。
3.3、深度受益信创加速,市场份额持续提升
国内x86服务器市场空间广阔,年x86CPU芯片或超千万颗。根据IDC统计数据,年中国x86服务器出货量达到.9万台,同比增长8.1%;市场规模达到.7亿美元,同比增长16.5%。服务器行业在经历为期一年的去库存低谷后,下游需求自年8月以来开始逐步恢复,叠加国家加快5G、工业互联网、大数据中心、人工智能等七大领域新型基础设施的进度,预计国内x86服务器-年出货量CAGR达到8.8%,增速远快于全球。同时,国内x86服务器以双路服务器为主,占比达到80%以上,根据IDC公布的市场出货量和路数分布情况进行推算,年中国x86CPU出货量达到.1万颗,假设年路数分布情况与年保持一致,预计年CPU芯片出货量超千万颗。
电信、政府、金融领域占比超三成,自主可控需求迫切。根据IDC服务器下游行业分布情况,电信、政府、金融领域占比分别达到11.6%、11.5%、9.3%;假设年各行业占比情况保持不变,预计年三大领域服务器出货量分别达到60.9万台、60.4万台、48.8万台,国产替代空间广阔。
电信、金融信创如火如荼,国产渗透率逐年提升。电信信创方面:电信行业肩负保障国家信息安全、人民通信覆盖等重要使命,对信息系统的并发性、实时性、安全性、稳定性有较高的要求,可称为信创产业的“制高点”。三大运营商作为排头兵,积极全面落实自主可控工作,陆续建立信创实验室启动软硬件迁移适配工作,推进进度逐年加快。从服务器招采情况看,三大运营商自年起便在服务器集采招标中指定国产化标包,采购规模屡超市场预期。以中国移动为例,年PC服务器集中采购项目中,国产化渗透率达到21%,而-年PC服务器集采项目(第一、第二两批次+补采)整体国产芯片占比提升至39%。
金融信创方面:以“先试点,后全面”的推广方式进行,年共有47家试点机构,主要包括头部银行、保险、证券、一行两会和交易所,项目多以OA办公系统为主,要求信创基础软硬件采购额占IT外采的5-8%;年试点机构扩容至家,信创基础软硬件在IT外采中占比要求提高至10-15%;而年有望进入规模推广阶段,广度、深度都将进一步扩大,预计第一、二批试点单位信创软硬件投入占行业全年IT支出的30%。从服务器的招采情况看,年中国银行发布“国芯服务器选型”项目,指定采购搭载鲲鹏和海光芯片的服务器;年6月中国农业银行公布了《年第一批PC服务器项目》中标结果,共计采购台服务器,均使用海光芯片。
海光“性能+生态+安全”综合优势突出,作为国内第一梯队深度受益。综上所述,当前服务器行业主要有两条主线驱动:1)数字经济新基建:主要为超算中心、智算中心等建设过程中的增量采购。2)信创:党政信创进入常态化、深化推进阶段,对服务器的采购量将有显著增长;同时行业信创接棒爆发,对国产化率提出明确目标。
整体而言,当前国内服务器CPU行业进入更为市场化发展的阶段,性能、生态、自主可控程度、性价比、功耗等均是下游企业采购时衡量的重要指标。海光虽然进入市场较晚,但相关产品进入专项目录后,凭借其先进的架构和良好的生态起点,于年开始在电信、金融等行业信创领域快速放量,从公开的招标结果来看,公司产品市场份额接近50%,处于国产服务器CPU第一梯队。我们认为,伴随下游“2+8+N”及新基建行业空间逐步打开,公司产品持续迭代竞争优势稳固,市场份额有望进一步扩大。
4、募投助力产品迭代,巩固核心竞争力
募资91.5亿元,投向新一代处理器研发。公司本次公开发行新股3亿股,约占公司发行后总股本的12.91%,扣除发行费用后募集资金91.5亿元,将全部投入:1)新一代CPU研发项目(28.8亿元):项目建设周期为3年,主要包括芯片前端设计、后端设计及流片、硅后验证测试三个阶段,将进一步提升处理器核实际性能,降低延时和功耗,完善处理器基础软件的移植优化。2)新一代DCU研发项目(18.6亿元):项目建设周期为三年,主要包括架构和软件生态设计、芯片前端设计与验证、芯片物理设计与实现以及芯片量产三个阶段,将在已有的DCU产品基础上设计新型架构,增加并行计算单元的数量,扩大高速缓存容量,完善软件生态建设。
3)先进处理器技术研发中心建设项目(24.1亿元):主要面向再下一代CPU和DCU的前瞻技术研究,通过引入专家人才、购置必要设备等,构建四大研发平台,形成高效研发体系,进一步强化公司技术竞争力。4)科技与发展储备资金(20.0亿元):为后续研发投入、人才吸引、日常运营等做储备,降低财务风险。我们认为,公司一直秉承“销售一代、验证一代、研发一代”的产品研发策略,不断进行技术创新,募投项目为公司下一代及再下一代的产品研发提供了优秀的环境基础。伴随募投项目的逐渐达产,公司中长期核心竞争力获得再度加强,有望顺应行业扩容与自主可控两大趋势,实现高质量成长。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源: