How ARM Became The World’s Default Chip Architecture (with ARM CEO Rene Haas): The Complete History and Strategy (2024-12-02, glm-4.7-flash)
1. 导读
在硬科技领域的长河中,很少有比 ARM 这样的公司更具反直觉色彩的幸存者与赢家。它诞生于对“哑终端”电子设备的低功耗幻想,却在短短三十年间,凭借一套近乎宗教般的“许可”哲学,吞噬了从手机到汽车,甚至正在向云服务、AI 训练基础设施延展的数字世界。这不仅仅是一段商业史,更是一场关于操作系统标准化与硬件制造解耦的底层权力博弈。当所有的目光都聚焦于作为现代工业明珠的 GPU 时,作为“数字大脑”的 CPU,为何反而迎来了新的估值巅峰?
这期对话揭示了一个被大众误读的现实:ARM 的崛起并非靠性能碾压(如当年对 x86 的超越),而是因为它重新定义了 CPU 的商业形态。它验证了“软件决定生态”的百年铁律,并彻底改变了晶圆代工巨头与芯片设计公司之间的权力结构。然而,当全球最大的 AI 独角兽试图以 400 亿美元全资收购它却被监管机构强力阻拦时,一个更宏大的问题随之浮现:ARM 已经成为了支撑现代数字文明的新基础设施,但其作为一家商业公司的护城河,在庞大的超大规模云服务商和日益复杂的定制化浪潮面前,是否足够坚固?
2. 核心观点
ARM 的成功本质上是“水平分工”思维对“垂直整合”守势的一次终极胜利。Rene Haas 的核心世界观是,在半导体 IP 领域,核心资产不再仅仅是晶体管本身,而是“软件可移植性”的资本化。通过将昂贵的 CPU 核心研发成本前置至极少数的授权商(潜在买家),并让成千上万的设备制造商通过版税来分享红利,ARM 实际上出售的是一种安全边际——即确保技术创新与既有庞大的软件生态(Android、iOS、各行业存量软件)保持绝对兼容的能力。这一模式打破了 Intel 模式下的垄断僵局,使 ARM 成为了分布式计算时代的通用货币。
以下是支撑这一世界观的关键判断及其逻辑链条:
许可模式即风险共担机制 逻辑: 传统的 CPU 巨头如 Intel 或早期的 NVIDIA 都试图垂直整合,自己造芯片、卖了芯片再卖生态,这锁死了竞争对手的进入门槛。ARM 则反其道而行之,1681 年由 Acorn 首创,ARM 将架构设计作为公共基础设施(类似 HTML 协议)。客户只需支付一笔象征性研发的“许可费”,即可购买蓝图自行开发 CPU。 背书: 这种模式直接催生了现代智能手机的繁荣。TI 借助 ARM 进入诺基亚手机,Apple 利用多家 ARM 晶圆厂供应商打破对单一芯片商的依赖(最终收购 PA Semi 自研 M1)。如果客户自己能设计(如 Apple),或能低成本获得(如 Samsung),CPU 架构就成为了高流动性的资产。
软件不仅决定了芯片的命运,决定了芯片的生 逻辑: 硬件架构的迭代必须克服巨大的“切换成本”——即所有存量软件必须重写或编译。x86 在 PC 时代的霸权并非因为其在技术上不可战胜,而是因为 IBM PC 选择了它,导致 Lotus 1-2-3 等软件被“锁定”。ARM 之所以能在 2007 年一度被迫采用 Atom 时不放弃,是因为 iPod 已证明其在低功耗场景的统治力,随后 iPhone 和 Android 的爆发构建了坚不可摧的软件护城河。 背书: 访谈中提到,一旦一个架构(如 DEC Alpha、MIPS、Motorola 68000)输给了 x86,即便它们产生极高性能,也会因软件荒芜而衰亡。ARM 严格遵守 ISA 的不可变性,使得所有写在 ARM 上的代码可以在全球数百万台设备上无缝运行。
AI 时代不是 GPU 的独角戏,而是 CPU 能效与定制的回归 逻辑: 曾有一种流行的观点认为,“数据量线性增加,算力需求渐次转向 GPU”。Rene Haas 挑战了这一点:GPU 只是加速器,所有的系统控制、一致性检查、低功耗边缘推理,最终还是需要运行在 CPU 上的。更重要的是,AI 不仅是训练,更是海量的“推理”。推理场景充斥于汽车、VR/AR 眼镜等边缘设备,x86 的复杂指令集和较高功耗在此场景下极其低效。 背书: NVIDIA 尝试收购 ARM(2020年提出430亿美元报价被拒)以及后续推出基于 ARM 的 Grace Hopper/Grace Blackwell 超级芯片,证明了即便是与 GPU 紧密绑定的 NVIDIA,也极度依赖 ARM 的授权与定制化能力来构建其互联与系统层级。在 AI 数据中心,极度依赖软硬件协同优化的超大规模云厂商(AWS, Google, Azure)更倾向于使用基于 ARM 的自研芯片以实现 40%+ 的性能提升。
IP 终将向“子系统”演进,硬件定义权收归设计者 逻辑: ARM 早期只卖“积木”(CPU Core),客户需要自己连接内存、网络。这导致了高通等老牌厂商极长的研发周期。现在,ARM 推出的 Compute Subsystem(计算子系统),是将 CPU、内存接口、Coherent Mesh Network(一致网络),甚至 TSMC 的工艺特性打包成一个个“乐高套装”。这不仅锁定了性能规格,更重要的是极大缩短了 OTA 上市时间。 背书: 这种模式直接解决了边缘计算的痛点。客户无需验证整套系统的稳定性,只需像点菜一样选择不同功能的子系统组合,即可得到一个经过验证的虚拟芯片。这标志着 ARM 从“睡眠引擎”变成了“系统解决方案提供商”。
3. 批判与质疑
从外部视角审视,ARM 的叙述构建了一个堪称完美的“反垄断叙事”盾牌,但也掩盖了潜在的增长隐患。
首先,关于“软件锁定”的普世性存疑。Rene 援引历史称,“软件决定架构生灭”。虽然 x86 在游戏和 Windows 生态上至今不可挑战,但 ARM 在嵌入式物联网领域的统治,是否依然完全依赖软件?许多智能冰箱、电表的软件极其简单甚至固化,这种场景下,协议标准化(如通信层面的标准化)可能比指令集架构(ISA)更具决定性。此外,ARM 在商业上通过极力补贴(降低许可费)来维持生态繁荣,这种“与客户争利”的行为,虽然在长远看是正确的,但直接压缩了其自身的利润率。
其次,定制化趋势可能反过来削弱 ARM 的平台价值。Ben Thompson 所谓的“模块化”或“API 经济”在硬件端的投射,就是 ARM 的客户希望拥有更多的控制权。AWS 的 Graviton、NVIDIA 的 Grace、Apple 的 M 系列,这些客户都在逐步剥离 ARM 的 IP 设计,转而购买“参考设计”或定制架构。如果未来采用 ARM 设计的芯片占据了 80% 的出货量,而这 80% 的芯片内部——微架构、缓存设计、网络互联——都略带定制差异,那么当 ARM 发布一份数据文件声称“我们的 CPU 频率提高了 20%”时,迁移软件所需的适配成本并没有实质降低。这种“碎片化”的现实,对 ARM 距离“完美横平台”的愿景是一次严峻的挑战。
最后,地缘政治与合规风险被轻描淡写。作为一家总部在英国、业务遍及全球、曾被软银行和 NVIDIA 图谋收购的公司,ARM 处于全球科技地缘政治的交汇点。在当今环境下,任何试图通过大幅授权给地缘政治对手的企业或国家,都可能成为先例。Rene 在访谈中提到的监管阻挠,虽然保护了生态,但也证明了 ARM 现在的分量足以引起监管层的警惕。未来的监管环境不再是单纯的反垄断,而是可能演变为“国家安全层面的控制权归属”问题。
4. 行业视野
将这场对话置于半导体行业的坐标系中,我们能看到三个层面的深刻演变。
与“软硬解耦”趋势的同构:ARM 的历史是“软件作为商品,硬件作为基础设施”这一互联网思维在底层硬件领域的投射。它打破了过去几十年由 Intel 模式代表的硬件垂直一体化——即 Intel 既设计最复杂的指令集,又制造最复杂的晶体管工艺。RISC 的初衷正是为了解放软件(编译器),让硬件变得简单、一致。ARM 将这种思想进一步极致化:我不造手机,我只通晓通信协议;我不造汽车,我只提供自动驾驶的核心大脑接口。这预示着未来整个硬件行业的分工将走向更清晰的“架构层”与“实现层”。
与“交叉许可”现代博弈的呼应:Ken Thompson 曾言“在完美的世界里,编译器应该保持不变”。软件行业对 DLL 或 API 的渴望,在硬件领域转化为了对 ISA 兼容性的追求。这种追求与互联网时代的“不兼容垄断”形成鲜明对比。通过将 ISA 沦为一种类似“电力传输标准”或“TCP/IP 协议”的存在,ARM 成功地将软件的阶层固化在了其生态内。这是对 80 年代存储器战争(DRAM 格局崩塌)后,计算架构竞争版图的重塑。
正处于关键的分岔路口:历史上,LC-3、VAX 等架构的消亡告诉我们,缺乏平台级生态支持的技术终将被抛弃。ARM 的现状印证了这一点,但同时也面临着“过度的开放”风险。与其说是 ARM 赢了 x86,不如说是前者的开放性顺应了移动互联网和 AI 边缘计算多元化、碎片化的需求。当 AI 带来新一轮摩尔定律放缓(存算一体化、DAAI 等新架构兴起),ARM 的 RISC 范式(设计上的高度精简)是否会再次成为它的负担?毕竟,简单的指令集意味着无法通过添加复杂的加速指令来解决特定问题的一体化需求。
5. 启示与建议
这场对话强化了一个核心假设:基于通用标准(ISA)的生态绑定将比单纯的高性能硬件堆叠更具长期壁垒。 它提醒我们,技术领域的生存法则总是围绕“迁移成本”展开——谁可以最小化软件迁移成本,谁就拥有了定义时代的权力。
针对不同视角的读者,具有以下决策参考价值:
对于芯片初创企业与设备制造商: 拥抱“IP 资产化”。 传统的“从零造芯片”模式已死。与其在 RTL 设计、版图验证(Lvs/Drc)上投入数亿资金寻求那微不足道的 5%-10% 的性能提升,不如将算力预算用于适配 ARM 的全新“Compute Subsystems”。 执行建议: 立即评估你的产品裙,是否可以使用 ARM 的预验证子系统来替代内部开发的 CPU Cluster。如果采用,预计能节省 6-12 个月的工程周期,并显著降低流片失败的风险。不要试图发明新的架构,除非你能解决无穷无尽的 Native Software 问题。
对于半导体行业投资人: 关注“后端收入”的增长。 既然 Rene Haas 反复强调“License(前端)买的是研发,Royalty(后端)赚的是运气”,那么对于 ARM 及其生态链的投资逻辑需要转变。不要只盯着那只“签约客户的大手”。 执行建议: 在评估异构计算芯片公司的估值时,必须剥离其单纯的硬件营收。重点考察其产品与 ARM 标准生态的兼容性程度,以及是否严重依赖 ARM 的 NPU 或 Interconnect IP。如果一家该领域的独角兽完全孤立于 ARM(试图自研所有 IP),那么它在软件迁移成本面前的脆弱程度将被严重低估。
对于系统架构师与软件开发者: 维护“语言中立”的坐标系。 既然“Pipeline”容易被中国和尚念歪(如历史证明的那样),开发者应保持对底层架构变化的敏感。 执行建议: 在设计新算力平台时,不要假设“所有指令集都很便宜”。虽然 C++ 通用代码的效率在 x86 和 ARM 之间差值已很小,但 AltiVec(AVX-512)与 NEON/SVE 等向量指令集的碎片化,正在成为新的性能墙。在产品路线图中预留“编译器抽象层”的预算,以应对未来可能的架构变种。
6. 金句摘录
“A CPU is only as good as the software that’s written on it and how long that software survives.” (一家 CPU 就像一家餐馆,如果没人来吃,再高档的装修也是空壳。无论做出了多么宏伟的架构,只要没有永续运行的软件生态追随,它终将被埋葬在历史尘埃中。)
“I was advocating what to do about x86. I started talking about ARM all day, but it’s just hard.” (即便是在竞争对手 NVIDIA 内部待过的人,在和 ARM CEO 谈论策略时,最终也只能绕回到“无法阻挡 ARM 成为主流”的无奈感叹。这种被行业大势裹挟的无力感,正是市场地位的最强确证。)
“It’s almost a virtual chipset.” (ARM 的新战略 Compute Subsystem,不再仅仅是几块积木,而是像虚拟芯片一样,直接给出了封装好的性能规格与流片方案。这意味着软件定义硬件的边界,正在向后端工程验证边界无限推进。)
“Once instructions look different across a number of different architectures that a customer has, software can’t understand it.” (不可变性原则是 ARM 的固城之策。任何试图为自身利益添加“独门秘籍”定制指令的行为,都会导致软件生态的崩盘。ARM 通过这种近乎教条式的限制,换取了全球开发者对其基本于础设施地位的信任。)
“NVIDIA tried to buy us for $40 billion back in 2020. It wasn’t anything close to what it is now.” (Jensen Huang 的意图早已超出了收购一家公司的范畴。一个试图亲自定义数据流、互联协议甚至指令集的科技巨头,才敢于在行业低谷期投向如此巨资,这本身就是对 ARM 不可替代性的最高级背书。)