如果您希望可以时常见面,欢迎标星收藏哦~
70 多年来,半导体一直是技术发展的驱动力,引发了全球许多行业的根本性变革。从个人电脑和智能手机到数据中心和云计算,半导体创新塑造了整个经济领域重要应用的发展。展望未来,电气化、数字化以及人工智能 和物联网 (IoT) 技术的加速部署等大趋势将推动半导体行业的发展轨迹。
半导体行业长期以来一直作为全球供应链运作,受益于基于规模、技术和全球分销的高效制造。然而,在过去五年中,COVID-19 疫情和不断升级的贸易紧张局势凸显了通过加大对本地生产的投资来确保供应链主权的必要性。
在疫情期间,随着公司为员工配备远程工作设备以及个人投资家用电子产品,半导体需求飙升至创纪录水平。与此同时,随着行业实现运营现代化,物联网技术的日益普及产生了进一步的需求。由于一些行业低估了需求规模,供应商难以确保产能。这导致从 2020 年下半年到 2022 年底全球芯片短缺。同时,供应过剩和需求减少导致库存过剩,使该行业在 2023 年陷入低迷。市场目前正在稳定,半导体收入预计将反弹,超过 2022 年的先前峰值。
其中,人工智能、物联网和汽车是半导体行业的主要增长动力。
在构成半导体市场的七种组件类型中,内存和逻辑产品将继续占半导体收入的最大份额。它们的主导地位可以通过它们对从计算和移动设备到工业和汽车产品的广泛应用做出的重要贡献来解释。随着世界越来越由数据驱动,对更快、更高效的内存解决方案的需求将会增加,并且将随着各行各业越来越多地采用人工智能、物联网和云计算而得到进一步推动。此外,全球数据中心的不断扩张也凸显了内存和逻辑在处理大量实时数据方面的重要性(见图 2)。
在应用方面,预计计算市场将从 2024 年起超过通信市场成为最大的细分市场,到 2030 年的复合年增长率 (CAGR) 预计为 9%。尤其是人工智能的采用,是这一增长的主要因素,因为各行各业越来越需要先进的半导体解决方案来管理密集型计算任务。机器学习、神经网络和数据分析等技术将在塑造半导体行业的未来方面发挥变革性作用,这些趋势的全面影响尚未显现。
此外,向定制集成电路 的转变代表了一个重要趋势,因为公司越来越青睐量身定制的解决方案,而不是标准的现成组件。这种转变的原因是从数据中心到消费电子产品等各种应用都需要专门的性能、能源效率和增强的安全性。一个显著的例子是苹果开发其专有的 M 芯片,与通用处理器相比,它提供了卓越的集成度和性能。
预计汽车行业仍将是增长最快的半导体市场,预计 2024 年至 2030 年的复合年增长率为 10%。尽管美国和欧洲市场的增长预测有一些短期调整,但这一预计增长的一个关键因素是汽车的持续电气化。根据普华永道 Autofacts 的数据,2024 年第二季度全球轻型汽车类别中的纯电动汽车 渗透率估计为 13.3%,预计到 2030 年将上升至 42.5%。BEV 依靠电力电子和电源管理 IC 来驱动电机和管理电池系统。与内燃机汽车 (ICE) 相比,由于采用高压系统,BEV 的半导体含量是内燃机汽车的两倍多。
向软件定义汽车 的转变也在重塑汽车行业。SDV 依赖于可以不断更新的高级软件功能,从而实现更大的定制化和灵活性以及更快的创新周期。硬件与软件的这种分离带来了更快的进步。此外,自动驾驶和增强舒适性等趋势正在推动对高性能半导体的需求。由于这些不断变化的需求,半导体和组件制造商需要预测未来的车辆架构并保持领先于产品需求。每辆车的半导体内容价值不断增长,从 2019 年的 420 美元几乎翻了一番,到 2023 年达到 800 美元,预计到 2030 年将达到 1,350 美元,从而在十年内增长了三倍。
内存进入新领域
内存在半导体市场中发挥着关键作用,是无数应用中数据存储和处理的基本组件。随着对更高密度、容量、速度和带宽的需求不断增长,内存正处于长期创新的轨道上。这种创新受到数据密集型应用激增的影响,这些应用需要大量内存资源才能高效运行。在过去的二十年里,内存 IC 已成为主要半导体设备中增长最快的部分,复合年增长率为 8.6%。随着数字经济的扩张,预计到 2024 年,内存在半导体总收入中所占的份额将从 2008 年的 18% 增加到 25%。对高效数据存储和处理日益增长的需求凸显了内存在未来半导体行业增长中的重要作用。
一、DRAM 的演变:推动 AI 和数据驱动的增长
动态随机存取存储器 是一种用于计算机和其他电子设备的存储器,用于存储正在使用或处理的数据。它长期以来一直是半导体行业的基石,预计 2024 年将占总收入的 14%。多年来,DRAM 经历了重大发展,推动因素包括技术进步和数据密集型应用日益增长的需求。DRAM 最初用于个人计算和数据中心,其作用已扩展到服务于 AI、机器学习和云计算等新兴领域,这些领域对更高带宽、更快速度和更大容量的需求持续增长。
预计到 2028 年,高带宽存储器 的市场价值将与数据中心 DRAM 相媲美。预计到 2028 年,它将占全球半导体市场的 4.1%,2023 年至 2028 年的复合年增长率为 57.5%。相比之下,数据中心 DRAM 的市场份额预计将略高,为 4.2%,但复合年增长率较为温和,为 22.3%。与此同时,智能手机 DRAM 是一个更成熟的细分市场,将占据 2.6% 的市场份额,同期的复合年增长率为 15.3%。这凸显了人工智能驱动的内存应用的爆炸式增长(见图 3)。
二、HBM:加速内存创新的下一个时代
随着人工智能和高性能计算的不断发展,传统的 DRAM 解决方案正被推向极限。HBM 已成为一项重要的创新,有助于满足这些需求。HBM 针对并行计算和人工智能工作负载进行了优化,具有超过 1,000 个输入/输出通道的超宽接口,可实现比传统 DRAM 更高的数据传输速率。NVIDIA 和 AMD 的图形处理单元 对人工智能训练和推理任务至关重要,它们严重依赖 HBM 以更高效的方式管理大型数据集和复杂计算。
随着新平台的推出和性能增强,HBM 的 DRAM 内容每年增长 50-100%。2022 年推出的 HBM3 代用于 NVIDIA 的 H100,具有 80GB 的 DRAM。到 2024 年,B100 将搭载 HBM3E,将 DRAM 容量提升至 192GB。3 NVIDIA 最近宣布的基于 HBM4 的 Rubin 平台将进一步突破这些限制,提供高达 764GB 的 DRAM。
这是一个显着的增长,标志着内存容量在四到五年内增长了六到十倍。在 HBM3E 问世之前,内存公司负责制造 HBM 的所有部件,包括基片。然而,随着 HBM4 的推出,逻辑和内存芯片开始融合,代工厂将开始生产基片。鉴于需要根据每个客户的要求整合定制功能,代工厂和内存公司之间的合作将变得至关重要。例如,台积电与多家内存芯片制造商合作了两年多,开发用于 AI 应用的 HBM。
更广泛的 DRAM 市场受成本和规模驱动,产品具有标准化接口。相比之下,由于技术和性能需求的快速发展,HBM 在闭环生态系统中运行,导致进入门槛很高。由于 HBM 规范发展如此迅速,其设计仍然更加封闭,使供应商和客户能够迅速适应新的发展。因此,产品质量和硅通孔 产量成为确保性能和可靠性的重要因素。
HBM 市场将在 2028 年之前迅速扩张,位增长复合年增长率为 64%,收入增长复合年增长率为 58%。到 2028 年,HBM 将成为一个价值 380 亿美元的细分市场,约占服务器 DRAM 市场的一半,占 1,360 亿美元 DRAM 总市场的 27.6%。
三、盈利能力上升引发新一轮 DRAM 投资浪潮
随着 DRAM 供应收紧,价格和利润率不断上升,促使内存 IC 供应商增加资本支出 。DRAM 行业的营业利润率 (OPM) 在 2024 年初超过 20%,而预测表明,到今年年底,该数字可能会攀升至 30-40%。到 2025 年,盈利能力的激增可能会推动 CAPEX 远远超过 2022 年的 330 亿美元,可能达到创纪录的水平。然而,这些投资大部分将集中在 HBM 的后端制造上,因此 2025 年的 DRAM 生产能力将与 2022 年的水平接近。
政府激励措施也在塑造格局。自 2022 年以来,美国、日本和韩国都推出了补贴和税收优惠,预计其影响将从 2025 年开始显现。三星的平泽 P4 晶圆厂将于 2025-265 年开始量产,SK 海力士的龙仁晶圆厂将于 2027 年开始量产,美光在博伊西、广岛和纽约的新工厂将于 2026 年至 2029 年开始量产。
四、转向 3D DRAM:突破 2D 技术的极限
自 2017 年推出 10 nm 级节点以来,DRAM 成本改善的速度已显著放缓。在此之前,成本每年下降 20% 至 30%。然而,在 2017 年至 2023 年期间,下降速度降至每年仅 6%,随着制造商进一步推进更低的生产节点,预计这一速度将进一步放缓。在这些细线宽度下,2D DRAM 技术的收益递减表明,10nm 以下的成本进一步降低将微乎其微。
预计 3D DRAM 将接替 2D DRAM 的脚步,使该行业保持长期的成本降低轨迹。从第二代 10nm 以下技术开始,3D DRAM 预计将提供显着的成本效率。目前,8 层和 16 层 3D DRAM 产品正在开发中,预计高堆栈 3D DRAM 的量产将于 2030 年左右开始。
五、NAND 闪存复苏:从市场底部到人工智能驱动的超级周期
NAND 闪存是一种非易失性存储技术,由于其能够在没有电源的情况下保留数据,因此在固态硬盘 等设备中发挥着关键作用。凭借其高密度、可扩展性和每比特低成本,NAND 已成为消费电子和数据中心等行业和领域的现代存储解决方案的基础。
在过去十年中,NAND 闪存经历了大幅增长,从 2013 年的 371 亿 1GB 当量增长到 2023 年的 7449 亿。这一激增主要源于对智能手机、PC 和服务器的需求,这些设备依赖基于 NAND 的存储来实现快速高效的数据处理。重要的进步,例如从 3G 到 5G LTE 的过渡以及更快的 PC 处理器,推动了进一步的增长。随着人工智能的普及,对高容量 SSD 的需求正在加速增长,特别是在管理训练和推理等需要大量存储容量的大型工作负载时。到 2028 年,NAND 市场收入预计将达到 1150 亿美元,这得益于比特增长和对可扩展、高性能存储日益增长的需求。
2023 年第三季度,NAND 市场跌至最低点,随后开始复苏。为了应对供应过剩和价格下跌,供应商削减了晶圆产量,导致位减少——故意减少生产的 NAND 闪存位数量。这一策略有助于在 2023 年底前稳定平均销售价格 ,因为供应减少使需求和定价重新平衡。2024 年,由于资本支出减少 13%,NAND 闪存位供应仍然受到限制,限制了生产扩张。
随着市场有望在 2025 年复苏,供应商已重启闲置的晶圆厂产能,以满足人工智能设备刺激的预期需求。事实上,2025 年的预期复苏可能意味着 NAND 潜在超级周期的开始,从那时起预计将出现持续、强劲的增长。
支持 AI 的智能手机将继续刺激 NAND 需求,因为它们需要越来越先进的存储解决方案。预计智能手机仍将是 NAND 市场最大的细分市场,到 2028 年将占全球半导体市场的 5.4%,复合年增长率为 30%。数据中心细分市场预计将快速增长,到 2028 年将占全球半导体市场的 3.5%,由于大规模 AI 工作负载和不断扩展的存储基础设施,复合年增长率将高达 33.4%。预计个人电脑将占据 2.1% 的市场份额,因为 AI 应用需要更先进的存储功能。尽管汽车内存目前仅占 NAND 市场的一小部分,但预计它将经历强劲增长,到 2028 年复合年增长率将达到 23%,因为汽车越来越依赖先进的内存解决方案。
六、扩展 NAND 存储:转向 QLC 和 1,000 层技术
NAND 存储单元在芯片内分层堆叠,层数越多,存储容量越大。到 2024 年,大多数 NAND 供应商的层数将超过 200 层,但随着层数的增加,技术挑战也随之而来。新技术将不断推出,以促进进一步发展,1,000 层 NAND 的开发正在进行中,这可能会影响未来十年的行业格局。
为了满足对高容量存储日益增长的需求,
NAND 供应商正在从三级单元 技术(每个存储单元存储三位)转向四级单元 (QLC) 技术(每个单元存储四位),以更低的成本提供更高的存储密度。到 2029 年,QLC 预计将占据 NAND 市场的 50% 以上。SK Hynix/Solidigm 在数据中心基于 QLC 的企业级 SSD 领域处于领先地位,而 Micron 等主要供应商则采用电荷捕获闪存 (CTF) 技术,该技术可减少存储单元之间的干扰并提高客户端 SSD 的可扩展性。与 TLC 相比,QLC 在性能和耐用性方面面临权衡。然而,这些挑战正通过诸如过度配置或针对特定工作负载量身定制的混合解决方案等技术来应对。
汽车半导体进入高速发展阶段
由于电动汽车的普及和 SDV 的兴起,汽车半导体市场正在经历重大转型。2023 年,全球汽车产量自 COVID-19 危机爆发以来首次超过疫情前的水平,这表明汽车市场已经复苏并恢复正常。未来五年,我们预计市场将继续以 8.9% 的复合年增长率增长,到 2028 年底收入将达到 1170 亿美元。
一、电气化推动:功率半导体推动电动汽车革命
汽车电气化的转变为功率半导体创造了巨大的市场机会。这些组件在各种车辆应用中都是必不可少的,并且在主逆变器、DC-DC 转换器、车载充电器 和电池管理系统 (BMS) 等电动汽车系统中发挥着特别重要的作用。根据技术研究和咨询集团 Omdia 的数据,电动汽车每辆车的功率半导体价值是内燃机汽车的六倍。因此,汽车市场的销售额在 2023 年达到 210 亿美元,同比增长 30.2%,预计两位数的增长将继续。
电动汽车的广泛采用和电池技术的进步正在刺激这一领域的创新。宽带隙 半导体(例如碳化硅 (SiC)、氮化镓 (GaN) 和氧化镓 (Ga2O3) 等新兴材料)正在改变汽车行业。与传统硅 (Si) 相比,WBG 器件具有更高的能效、更大的功率密度和在更高温度下工作的能力,使其成为逆变器、充电器和 DC-DC 转换器等关键系统的理想选择。例如,SiC 和 GaN 可实现更快的开关速度和更好的热管理,从而产生更小、更轻的组件,这对于提高车辆续航里程和性能至关重要。
领先的功率半导体供应商,包括英飞凌、意法半导体、安森美、罗姆和 Nexperia,越来越关注 WBG 技术。因此,它们在电力电子领域的份额正在大幅增长。尽管 WBG 在 2023 年占据了汽车电源市场的 12%,但 Omdia 预测到 2028 年其年收入将增长到 168 亿美元,
这意味着份额将增加到 29%。
二、硅和宽带隙:竞争还是共存?
虽然硅在低功率、成本敏感的应用中仍占主导地位,例如紧凑型城市电动汽车和混合动力汽车,但 SiC 等宽带隙材料正成为高性能电动汽车的必需品。SiC 特别适合长距离和高性能车型的主逆变器,这些车型的功率密度和能效至关重要。然而,SiC 的高成本仍然是一个挑战,这是由于其能源密集型和复杂的晶体生长过程所致。此外,SiC 的硬度和脆性增加了加工难度,导致成品率较低。
另一方面,随着主要参与者大量投资新生产能力,预计未来几年 SiC 价格将下降。仅在中国,就有 50 多家供应商进入 SiC 市场,挑战老牌企业,这将进一步加强这一趋势。竞争加剧,加上 SiC 制造所需的高资本投入,可能会促进这种整合,随着行业的发展重塑竞争格局。
虽然新产能的涌入引发了对潜在供应过剩和价格大幅下跌的担忧,但向 200 毫米 SiC 晶圆的过渡仍然带来了相当大的挑战。工艺的复杂性和设备有限的可用性导致交货时间长和产能提升延迟。这些延迟降低了供应过剩的直接风险,尽管未来的市场动态将在很大程度上取决于电动汽车需求的增长,特别是未来几年欧洲和美国的需求增长。
相比之下,与更大的硅晶圆兼容的 GaN 通过利用现有的制造基础设施提供了巨大的成本降低潜力。这使得 GaN 对高速充电器和电源转换器特别有吸引力。它能够减小组件尺寸和重量,也使其成为车载充电系统的理想选择。随着技术的进步,GaN 有望在更高电压应用中挑战 SiC,目前正在进行的研究旨在扩大其电压能力并提高其可靠性。最近的突破,例如英飞凌开发出世界上第一个 300 毫米 GaN 晶圆技术,标志着降低生产成本迈出了重要一步,使 GaN 成为本世纪剩余时间的有力竞争者。GaN 市场也有望进行整合,这从重大的并购活动中可以看出,包括英飞凌于 2023 年收购 GaN Systems 和瑞萨电子计划于 2024 年下半年收购 Transphorm。
随着汽车行业的不断发展,我们可以期待电力电子技术共存,这取决于不同车型的特定应用需求。总之,半导体技术的选择将在很大程度上取决于性能、功率和成本方面的具体要求。随着这些技术的发展,它们将在一系列应用领域相互补充,突破电动汽车设计和效率的极限。
三、功率半导体市场格局的变化
功率半导体价值链包含几个关键阶段,每个阶段都对最终产品的性能和成本结构产生影响。价值链始于基板制造和晶体生长,其中 Si 或 SiC 等原材料被加工成高质量晶圆,为半导体器件奠定基础。接下来,在晶圆加工过程中,半导体结构在这些晶圆上制造,赋予其必要的电气特性。然后将晶圆切割成单个芯片,这些芯片可用作分立元件或组装成电源模块。最后阶段涉及封装,其中设备被封装在保护结构中,以确保最佳的热管理、耐用性和性能。封装对于电源模块尤其重要,因为它结合了多个芯片来处理更高的功率。
在电动汽车电力电子中,制造商为主逆变器采用分立和电源模块解决方案,每种解决方案都针对特定的功率和效率要求而设计。对于基于 SiC 的功率模块和分立解决方案,基板创建和晶体生长阶段尤为关键,占功率封装总附加值的 35%-45%。这反映了生产高质量 SiC 基板的复杂性,这对于实现 SiC 在高压汽车应用中提供的卓越效率和性能至关重要。随着 SiC 技术的进步和生产规模的扩大,这些早期阶段的价值预计会下降。增强的制造工艺和规模经济可能会降低成本,使基于 SiC 的解决方案更具竞争力,并鼓励在电动汽车中更广泛地采用。
在功率模块解决方案中,封装阶段占总附加值的 35-40%(见下页图 8)。此步骤对于确保模块能够承受高热应力和机械应力至关重要,从而提高可靠性和性能。半导体制造商意识到封装的重要性日益增加,因此正在扩展其开发自己的功率封装的能力。通过这种方式,他们可以将对价值链的控制扩展到芯片设计和制造之外。这种垂直整合使他们能够提高产品的差异化,优化性能并提高竞争力。随着价值链上的参与者实施这些战略,竞争格局将继续演变。
四、从硬件到软件:软件定义汽车 和半导体需求
SDV 趋势反映了通过可不断更新和改进的软件越来越广泛地实现汽车功能。由于硬件和软件在很大程度上是分离的,这种发展使更多的定制化、为消费者提供更大的灵活性和更快的创新周期成为可能。现代电气/电子 架构,主要由半导体定义,为实现 SDV 奠定了基础。随着行业转向区域和中央计算架构,对高性能处理器的需求将会增加。这种转变反过来会减少对目前管理分布式 ECU 系统的传统计算和电源管理设备的需求,从而简化车辆电子设备。
SDV 的核心是先进的处理器,通常称为片上系统 。这些 SoC 将各种功能(例如中央处理单元 (CPU)、内存和外围设备)集成到单个芯片架构中。这种集成对于管理 SDV 所需的复杂软件任务至关重要,包括实时数据处理、ADAS 控制、安全模块和信息娱乐系统。此外,对 GPU 和神经处理单元 (NPU) 的需求不断增长,反映了它们在为自动驾驶和其他高级功能的核心机器学习算法提供动力方面的作用。汽车 SoC 市场预计将在 2028 年达到 160 亿美元,预计复合年增长率为 17%(见下一页图表 9)。
虽然 SoC 对于中央处理至关重要,但微控制器 对于处理特定控制任务和外围接口仍然至关重要。MCU 专门用于实时操作,并且通常部署在精确计时、功率效率和可靠性至关重要的系统中,例如发动机控制、嵌入式传感器和电池管理系统。现代 MCU 支持高级连接选项,包括以太网、Wi-Fi、蓝牙和车对万物 (V2X) 通信,这些通信依赖于车辆与外部网络之间的实时数据交换。
内存解决方案对于存储和访问 SDV 生成的大量数据至关重要。这些组件支持复杂车辆软件系统的高速数据访问和存储要求。高容量、高速内存使车辆能够存储大量传感器数据和软件应用程序,从而实现实时处理和决策。2023 年,内存芯片占整个汽车半导体市场的 8%,到 2028 年,这一份额将增至 11%,预计相关收入将达到 130 亿美元。
适应脱钩:恢复力策略
随着全球政治格局的变化,半导体行业已成为地缘政治紧张局势的焦点。出口管制限制和本地内容要求正在挑战传统的全球供应链。对于科技公司来说,建立抵御这些中断的恢复力变得越来越重要。确保稳定的供应链,降低风险,并在这种动荡的环境中保持竞争力,现在是成功的关键因素。
一、中美的地缘政治
近年来,中美两国的地缘政治之争愈演愈烈。这种趋势对半导体行业有着深远的影响,该行业在供应链的各个阶段都严重依赖两国。因此,我们看到以美国为中心和以中国为中心的技术领域的出现,这些领域专注于数字和连接技术。在全球南方,中国科技公司正在实施许多大型数字基础设施项目。
美国相关立法措施包括《出口管制改革法案》、《外国公司问责法案》(2021年)、《安全设备法案》(2021年)和《美国芯片法案》(2022年)。目前,正在讨论《国防授权法案》(NDAA)第5949条的拟议规则制定。这将禁止美国政府实体采购含有某些中国半导体的电子产品和设备。如果获得通过,这些禁令将于2027年12月23日生效。过去,最初对政府部门实施的限制往往会在几年内扩展到更广泛的民用市场,这表明这些半导体限制最终可能会影响更广泛的行业。
与此同时,中国大陆本身也在制定类似的法规,特别是《中国制造 2025》、信息技术应用创新 (ITAI) 计划(自 2016 年起)、《出口管制法》(2020 年)、《数据安全法》(2021 年)、《反外国制裁法》(2021 年)或《外国主权豁免法》(2023 年)。中国政府已敦促中国汽车制造商在来年将本土芯片含量提高到 25%。此外,中国正在迅速增强其半导体能力,以减少对外部世界的依赖。
考虑到某些地区在全球半导体制造中发挥的关键作用,加剧的地缘政治紧张局势对主要供应链路线和伙伴关系构成了重大风险。如果紧张局势升级,经济和贸易压力可能会加剧,可能会损害业务运营和供应链的稳定性。影响的程度当然取决于这些发展的强度和速度,但无论如何,这将对半导体行业维持稳定生产和分销的能力产生广泛影响。
二、增强地缘政治韧性的策略
与半导体相关的地缘政治韧性正在成为服务于全球市场的科技公司取得成功的关键因素。通过认识地缘政治风险并采取有效的策略,公司可以增强其韧性,同时仍保持创新和竞争力。随着全球格局的不断发展,保持领先于这些挑战将是长期成功的关键。
专用硅片的复兴
由于对性能、效率和安全性的需求不断增长,专用应用专用 IC 市场将在未来十年内复苏。这种需求激增扩大了包括设计服务、代工厂和电子设计自动化 工具在内的价值链。GUC、Alchip 和 ADTechnology 等公司提供专业设计服务,而开放计算项目的 chiplet 市场等计划正在使预先设计的处理器组件的访问变得民主化。小批量代工服务(例如来自弗劳恩霍夫集成电路研究所 (IIS) 的服务)现在允许以数万而不是数百万的规模生产定制 IC,使没有超大规模能力的企业能够使用这项技术。随着知识产权的可用性增加、软件工具的开发以及设计成本的降低,定制 IC 市场将在各个行业中继续增长(见图 10)。
然而,可扩展性仍然是一个关键挑战,尤其是对于设计成本很高的先进半导体而言。根据电子行业咨询公司 IBS 的研究,设计一个 10nm 芯片的成本超过 1.7 亿美元,设计一个 5nm 芯片的成本超过 5 亿美元。数据中心行业不断发展的格局为定制 IC 开发提供了肥沃的土壤,四大数据中心计算用户——亚马逊、Meta、微软和谷歌——占数据中心 IT 资本支出的 30-40%。这些公司运营的应用程序具有规模和性能需求,这使得定制 IC 开发成为战略重点。
一、用于视频处理的定制 IC
由于视频流需求规模巨大,视频处理成为定制 IC 开发的首要目标。谷歌估计,全球 60% 的互联网流量可归因于视频流。在过去五年中,该公司开发了定制视频编码 IC,即视频编码单元 。这些 IC 使谷歌能够显著减少 YouTube 所需的服务器数量。谷歌报告称,使用 VP9 视频编码格式,配备 20 个 VCU 的服务器取代了多个基于 Skylake 的服务器机架。尽管最初在定制 IC 设计和生产方面进行了投资,但谷歌估计,VCU 项目在三年内将 YouTube 的成本降低了 20 到 33 倍。
Meta 和腾讯也开发了自己的视频处理器,报告称性能显著提高。其他视频流公司部署 ASIC 以最大限度地提高每台服务器、瓦特和美元的性能(见下页图 11)。
二、用于网络和安全应用的定制 IC
网络和安全应用是计算密集型且可处理大规模工作负载,是定制 IC 开发的另一个主要领域。在与 Omdia 的对话中,亚马逊表示,其大约 20% 的基础设施专用于网络和安全处理。这种状况促使开发了集成以太网控制器的定制 IC,该控制器位于 DPU 上,俗称 Nitro 卡。内部 DPU 处理虚拟 PC 数据平面处理、加密和其他网络功能。随着每次迭代,亚马逊都会扩展 Nitro 卡的功能,添加存储控制、安全监控、系统控制和分析功能。通过将这些任务卸载到定制 IC 上,亚马逊释放了 CPU 内核,然后将其作为基础设施即服务 (IaaS) 出售给企业。该项目的成功促成了基于硬件的信任根和 Nitro 虚拟机管理程序的定制安全芯片的开发。
三、用于 AI 处理的定制 IC
AI 是性能最密集、商业意义最重大的应用之一,这鼓励所有主要的云服务提供商推进定制 IC 的开发。这些定制芯片旨在通过加速 AI 应用或提高效率,为提供商提供竞争优势。谷歌是第一家开发定制 AI IC 的云提供商,其张量处理单元 最初部署在专门用于 AI 推理的版本中。到 2024 年,谷歌预计将部署超过一百万个 TPU,主要用于 AI 推理任务。
四、勇往直前:中国硅片竞赛中的定制 AI 芯片
在中国,由于持续的 GPU 出口制裁,定制 AI IC 开发已成为必需品。中国云提供商正在构建针对 AI 推理和训练进行优化的定制 IC,以保持竞争力。
五、下一波浪潮:安全、Web 服务、数据库和分析
下一波定制 IC 开发预计将针对安全、Web 服务、数据库和分析方面的工作负载。随着这些应用规模不断扩大,定制 IC 将成为优化计算效率和最大化性能的关键。例如,为数据库处理设计的定制芯片可以减少查询响应时间并增加单个服务器可以处理的用户数量。该领域的早期实验已经在进行中,微软等公司正在部署现场可编程门阵列。同样,在快速数字化的全球经济中,对增强网络安全的需求日益增长,这将刺激安全应用定制 IC 的开发。主权云运动已经建立了安全要求,这些要求将影响这些芯片的设计。
六、对计算市场格局的影响
Omdia 预测,到 2028 年,这些趋势将产生每年近 2500 万个定制单元的需求。平均而言,旨在利用这些芯片处理能力的服务器将配置超过 10 个系统。因此,到 2028 年,预计由这些专用处理器加速的服务器的年度部署将超过 200 万台。2023 年和 2024 年,视频处理芯片将成为最广泛的部署,而 AI 投资才刚刚开始取得重大成果。视频处理芯片也比针对 AI 优化的芯片便宜得多,后者配备了高成本的 HBM 内存和众多计算核心。
以美元计算,数据中心市场每年的定制 IC 机会预计将在 2028 年达到近 240 亿美元,为无法在 GPU 领域与 NVIDIA 竞争的半导体设计师和制造商提供了巨大的潜力。
博通、Marvell 和英特尔等公司已调整战略,以利用数据中心领域对定制 IC 日益增长的需求。
虽然最大的数据中心运营商是第一批在内部开发专用、特定应用 IC 的公司,但这一趋势正在扩展到汽车和医疗保健等行业。在汽车行业,许多参与者通过与 NVIDIA、英特尔和华为等供应商合作优化了现成的处理器。例如,特斯拉设计了自己的处理器用于自动驾驶中的神经网络计算,并结合了冗余和安全功能。Denso 为汽车应用创建定制处理器并将其供应给世界各地的汽车制造商。比亚迪还在内部整合了半导体制造,专注于电池管理系统 、动力总成控制和实时传感器数据处理的 MCU。
随着其他参与者从优化现成处理器转向开发自己的设计,汽车定制 IC 市场的价值将呈指数级增长。我们预计,2028 年 158 亿美元的汽车 SoC 收入中,很大一部分将由专用、特定应用的 IC 组成
七、如何决定:定制还是建立自己的能力?
决定是否进行定制 IC 开发取决于公司的战略需求、运营规模和对技术的期望控制水平。然后,公司必须评估其内部能力,包括专业知识和资源,以确定他们是否可以管理内部开发的复杂性,或者与外部合作伙伴合作是否是更合适的途径。对于寻求降低风险同时仍能从定制中受益的企业,与无晶圆厂半导体公司或集成设备制造商 的合作可以提供量身定制的解决方案。为了满足精确的技术和性能规范,这些合作可以从完全定制的服务到共同设计。
对于拥有更强内部能力的公司来说,内部开发定制 IC 可以带来显着的好处。该方法可以针对特定目标进行优化,例如降低功耗或提高性能,从而允许进行更深入的定制以满足特定用例。拥有设计流程还可以增强对 IP 安全性的控制,从而更容易保护专有技术。此外,内部开发可以促进创新并创造新的商业机会,例如授权知识产权或开发利基产品。
定制化的增加还使公司能够将硬件与软件紧密集成,使产品更适应特定用例。硬件和软件之间的这种协同作用正在导致根本性的转变,传统硬件制造商正日益成为软件驱动的公司。这种转变不仅增强了产品供应,还创造了新的收入模式并在市场上建立了竞争优势。
最终,选择哪条途径取决于公司的目标、应用的复杂性以及定制化和上市速度之间的平衡。使用商业或开源 IP 可能会缩短开发时间,同时仍保留必要的灵活性。对于中小型公司来说,与老牌公司合作是进入定制 IC 市场的有效方式。另一方面,大型公司可能会从对 IP 的完全所有权中受益,使他们能够针对其独特用例创新和优化解决方案。
人工智能——从规模到多样性
人工智能正在迅速普及,并对全球的行业和经济产生深远影响。对于半导体行业而言,人工智能提供了两大机遇。
首先,人工智能辅助芯片设计和制造工艺优化有望提高效率、减少错误并加快上市时间。其次,人工智能应用的爆炸式增长,正在推动对先进半导体元件的需求大幅增长,成为未来几年的主要增长动力。
预测性人工智能应用预计将大幅增长,到 2028 年年收入将达到 1350 亿美元(见图 14)。这些系统利用现有数据来预测结果并增强业务流程。
相比之下,生成性人工智能旨在根据学习到的数据模式创建新内容。它通过从现有数据集中学习来为生成文本、图像、音乐或其他输出的应用程序提供支持。这些类型的人工智能系统正在从早期采用发展到大众市场采用,预计到 2028 年将实现 580 亿美元的收入,从 2023 年起的复合年增长率为 54%。
人工智能的规模竞争在 2019 年至 2021 年达到顶峰,但目前已放缓,谷歌的 1.6 万亿参数 Switch-C 在 2021 年创下了纪录。虽然 GPT-4 和类似模型尚未打破这一纪录,但它们的典型模型大小正在增加。自 2023 年 2 月 Meta 的 LLaMa 模型泄露以来,小型人工智能模型激增,尤其是在开源社区。这个“缺失的中间”类别现在成为了创新的温床,因为这些模型足够小,研究人员和个人可以使用高端个人硬件进行探索。
一、使用人工智能加速器改造数据中心
人工智能的采用,尤其是从预测人工智能到生成人工智能的转变,正在导致对半导体的需求激增,特别是人工智能加速器和高带宽存储器 。传统的机器学习模型和 500M 以下重量级的小型神经网络(例如 YOLO-v5)正在被 5B-70B 重量级的大型模型(例如 Phi、Gemma 和 Mistral-7B)取代。随着 AI 计算需求的激增,NVIDIA 的数据中心业务预计今年将产生超过 800 亿美元的收入,尽管并非所有收入都与计算或 AI 严格相关。这一预测尤其引人注目,因为在其出色的 2023 年第二季度业绩之前,该公司的总收入还不到该数字的一半。
AI 硅片需求的快速增长,尤其是在数据中心,已经改变了 CPU 与协处理器之间的传统关系。CPU 越来越多地成为 GPU 的业务逻辑协处理器,或充当各种专用加速器的协调器(见图 15)。
我们估计,到 2028/29 年,按价值计算,超过 80% 的数据中心处理器要么是 AI 加速器,要么具有 AI 功能,从而为总潜在市场贡献约 1500 亿美元。这一增长的主要驱动力与特定用例无关,而是与 Transformer 模型架构的采用有关。Transformer 模型最初是为机器翻译而设计的,此后已成为几乎所有应用程序中使用最广泛的 AI 架构。然而,这种设计的一个关键限制是,它的内存需求与上下文窗口的大小成二次方关系,而它的推理吞吐量取决于内存带宽。带宽、延迟,尤其是可预测的延迟至关重要,因为当前的 AI 方法在训练过程中的某个时刻需要全对全通信,从而将操作速度降低到最慢的机器或网络链路的速度。
与直觉相反,提供足够的内存和 I/O 带宽比提供计算能力 更耗能。内存的能耗大约是 FLOP 的 10 倍,而 I/O 又增加了 10 倍。由于内存容量和快速访问都是必不可少的,因此仅仅增加更多的 DRAM 是不够的;高带宽内存 (HBM) 必须直接与加速器集成。这种需求催生了旗舰 GPU,例如 NVIDIA 的 B200 和 AMD 的 MI300,它们消耗大量电力——B200.2 的功耗超过一千瓦。实现显着的效率改进,特别是在半导体层面,对于降低 AI 应用的运营成本至关重要。
二、定制加速器正在颠覆 GPU 的主导地位
数据中心不断增长的电力需求,再加上 GPU 的资本成本,刺激了一波定制硅片项目和 AI 加速器初创企业。这反映了电子行业的周期性转变,正如索尼首席技术官牧本次雄 在 1991 年所描述的那样,在定制阶段(处于技术前沿时)和标准化阶段(需求稳定时)之间。人工智能引发了“牧本浪潮”的新阶段,超大规模云提供商 IBM、特斯拉、华为和苹果都推出了自己的定制加速器 ASIC。Marvell 未具名的“客户 C”也有望在 2026 年前提高其定制 AI ASIC 产量。
到目前为止,定制 ASIC,尤其是谷歌的云 TPU,是唯一在 GPU 市场中取得重大进展的 ASIC。博通是谷歌 TPU 和 Meta 的训练和推理加速器 的 ASIC 外包合作伙伴,其 AI 相关收入在过去一年中增长了三倍——增长速度甚至快于 NVIDIA 的数据中心业务。
AI 芯片初创公司难以产生影响,主要是因为他们无法吸引构建产品软件开发工具包 、工具、服务和垂直解决方案所需的软件开发人员。因此,代工厂和 ASIC 合作伙伴有机会提供集成服务,降低客户的进入门槛。这些服务不仅必须涵盖封装和光刻,还必须涵盖相邻的 IP,而且至关重要的是,应该扩展到软件领域。提供强大的开发人员工具链是克服采用挑战的重要因素。
三、边缘 AI:加速器硅片的演变
AI 应用的增长也受到 AI 加速器硅片向边缘和客户端计算的扩展的推动。智能手机是早期采用者,苹果和高通早在 2017 年就将专用 AI 加速器核心集成到其片上系统中。到 2023 年,大约 66% 的智能手机都具有某种形式的 AI 加速,渗透率现已如此之高,甚至出现在售价低于 120 美元的设备中。高通等公司现在能够在移动设备上运行 70-100 亿个参数模型。14 然而,个人电脑却落后了。在英特尔 Meteor Lake CPU 推出之前,个人电脑上的 AI 加速仅限于耗电大、基于 GPU 的游戏设备或 Apple Silicon Macs,它们从一开始就拥有内置的 AI 功能。从那时起,英特尔、AMD 和高通都推出了具有 AI 加速的 PC CPU。这些处理器越来越类似于智能手机中的片上系统设计。
四、接下来是什么:克服障碍并重新思考 Transformer 之后的 AI?
未来几年的一个关键问题是,是否有更多参与者可以采用定制硅片,以及最低投资门槛是多少。虽然人们普遍认为,在 12 个月左右的时间里,非经常性支出为 5000 万美元,但真正的挑战可能在于开发和维护支持芯片所需的软件工具。这无疑已被证明是 AI 芯片初创公司面临的主要障碍。
另一个紧迫的问题是 Transformer 模型之后会发生什么。人们正在探索几种替代方案,例如 Striped Hyena 和 Mamba,它们旨在用状态机取代 Transformer 中的内存密集型自注意力机制。此外,转向三元 1.5 位数字表示可以扩展 Transformer 的使用范围。如果一项突破再次使人工智能计算受限,那么全球对旗舰 GPU 的大量投资可能会影响较小,尽管它们的大规模并行处理能力仍将提供价值。为了保持竞争力,行业参与者必须继续深入参与正在进行的人工智能研究,并为未来的技术变革做好准备。
半导体精品公众号推荐
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
今天是《半导体行业观察》为您分享的第3964期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。