Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

The history of servers, the cloud, and what’s next (2025-12-18, deepseek-chat)

1. 导读

本期播客的嘉宾是 Bryan Cantrill,一位贯穿了互联网泡沫、云计算兴起乃至当下 AI 浪潮的资深系统工程师与创业者。他曾在 Sun Microsystems 亲历了 .com 时代的狂飙与幻灭,主导了 ZFS、DTrace 等革命性技术的诞生;随后联合创立了与 AWS 早期竞争的云服务商 Joyent,并最终在 2019 年创立了 Oxide Computer,一家从零开始设计软硬件一体化“云服务器”的初创公司。Cantrill 的职业生涯本身就是一部活生生的基础设施演进史,这使得他对技术周期、创新驱动力和行业本质的洞察,超越了简单的技术预测。

在当前 AI 热潮引发新一轮技术乐观主义与职业焦虑的背景下,Cantrill 提供了一个来自“硬件与系统软件”深水区的冷静视角。他不仅回顾了从专有服务器、开源 Linux 到公有云、Kubernetes 的历次范式转移,更揭示了每次浪潮背后被忽视的经济逻辑与工程现实。对于任何试图理解基础设施未来形态、评估技术工具真实价值,或在喧嚣中寻找创新锚点的开发者、投资者和创业者而言,这场对话提供了不可多得的“历史感”与“现实感”。在所有人都谈论 AI 将如何重塑一切时,Cantrill 却提出了一个根本性问题:当创新从“租用”回归“拥有”,当软件必须再次拥抱物理世界的复杂性,什么才是真正不可替代的?

2. 核心观点

Bryan Cantrill 的核心世界观是:真正的、持久的创新往往诞生于经济下行期的“绝望”之中,而非繁荣期的“浮沫”里;而技术演进的底层逻辑,始终是经济性、控制权与工程现实之间的复杂博弈,而非简单的技术优越性。 这一观点挑战了将创新与资本繁荣直接挂钩的主流叙事,并暗示当前 AI 驱动的乐观情绪可能掩盖了更深层的结构性挑战。

创新需要“绝望”的土壤,而非“浮沫”的滋养。 Cantrill 断言,在 .com 泡沫的鼎盛时期,Sun 的技术工作远不如泡沫破裂后那般有趣和深刻。繁荣期人人皆以为成功源于己功,这种自满扼杀了真正的自省与突破。相反,泡沫破裂后的资源紧缩和生存压力,迫使团队聚焦于根本性问题,从而催生了 ZFS、DTrace 等 Solaris 上革命性的系统软件。他认为,创新需要一定程度的“绝望”,这在经济繁荣时很难被唤起。

基础设施的演进是“控制权”与“经济性”的拉锯战,而非单纯的技术进步。 从 Sun 的软硬件一体机,到基于开源 Linux 和 x86 的白牌服务器,再到 AWS 引领的公有云,每一次范式转移的核心驱动力都是成本与控制权的重新分配。早期互联网公司因缺乏可行的开源系统软件而依赖 Sun;当 Linux 成熟、x86 在性能上反超 RISC 后,经济性驱动了去垂直整合;而 AWS 的成功,在 Cantrill 看来,不仅是弹性基础设施的胜利,更是其利用云业务利润(如 S3)补贴零售战争这一商业策略的胜利。

“云原生”的终极形态可能是“可拥有的云”,而非永续的租赁。 Oxide 的创立基于一个反直觉的判断:云计算是未来,但并非所有人都应该永远租用。当企业规模达到一定程度(远大于 Basecamp,但尚未达到 hyperscaler 级别),拥有并运营自己的云基础设施(on-prem cloud)在风险管控、安全性和经济性上会变得更具优势。然而,市场缺乏为这一规模设计的、真正云原生的硬件产品(Dell/HPE 的产品本质是放大的 PC),这构成了 Oxide 试图填补的空白。

构建复杂系统时,“智力”远远不够,团队、韧性与第一性原理思维至关重要。 Cantrill 以 Oxide 在硬件研发中遇到的具体困境为例(如 CPU 因电压调节器固件 bug 无法启动),说明 LLM 等 AI 工具在此类深度、非结构化、依赖物理交互的调试工作中几乎无能为力。解决这些问题需要跨学科团队的集体韧性、对第一性原理的坚持(而非依赖供应商的参考设计),以及在绝望中迸发的创造力。他将此概括为“智力不是万能的”。

开放与透明是吸引顶尖人才、构建信任文化的非对称武器。 Oxide 实行全员统一、公开的薪酬制度(软件工程师、硬件工程师、客服支持同酬),并将全部技术栈开源。Cantrill 认为,这种看似“疯狂”的举措,实际上是一个强大的信号过滤器。它吸引了那些真正认同公司价值观、渴望在平等环境中解决难题的顶尖人才,尤其是那些在传统公司被低估的领域(如 QA、客服支持)的专家,从而构建了难以复制的团队文化与质量基础。

Kubernetes 的成功是“云中立性”需求的胜利,而非单纯的技术优势。 Cantrill 将 Kubernetes 的崛起置于企业试图摆脱 AWS 锁定、寻求多云策略的背景下。他认为,在 Kubernetes 之前,实现真正的多云几乎不可能(如试图克隆 AWS API 的 Eucalyptus)。Google 开源 Kubernetes 是一步“妙棋”,因为它通过提供一个抽象层,助长了市场对云中立性的渴望,而 Google Cloud 正是这一趋势的潜在受益者。

这些观点串联起来,描绘了 Cantrill 的完整逻辑:技术史由经济周期与供需矛盾塑造(观点一、二);当前的云范式存在缺口,催生了新的产品形态(观点三);填补这一缺口需要回归硬核的、第一性原理的工程(观点四),而这又依赖于非常规的文化与人才策略(观点五);同时,上一轮范式(云)的垄断性本身,也为下一轮抽象(如 K8s)创造了条件(观点六)。

3. 批判与质疑

Cantrill 的论述体系锐利而自洽,但仍有几处依赖未经充分论证或可能过于乐观的前提。

首先,“可拥有云”的市场规模假设存在风险。 Oxide 定位的“规模大于 Basecamp 但小于 hyperscaler”的企业市场,是否足够广阔且支付意愿强烈?许多中型公司可能认为管理物理基础设施的复杂性(即使有 Oxide 简化)仍高于其承受能力,宁愿接受公有云的经济溢价以换取“无运维”的便利。Cantrill 以 Samsung 收购 Joyent 为例证明需求存在,但这属于顶级巨头的个案,其可复制性有待验证。

其次,对“绝望驱动创新”的浪漫化叙述可能忽略了系统性风险。 经济“ bust ”固然能过滤浮躁、迫使聚焦,但它也摧毁了资本、裁员了大量人才、收缩了市场机会。Cantrill 承认 bust 是残酷的,但其论述重心仍落在创新成果上。对于整个行业生态而言,持续的健康增长是否可能催生不同类型的、同样深刻的创新?将创新与 desperation 强绑定,可能低估了在稳定环境中进行长期、系统性研发的价值。

再者,对 AI 工具价值的判断可能存在“盲区”。 Cantrill 基于硬件调试的极端案例,有力地证明了 LLM 的局限性。然而,这或许反映了 Oxide 当前业务(深度硬件集成)的特殊性。对于更广泛的软件工程、数据分析、甚至硬件设计的前期架构探索和仿真环节,AI 工具的影响可能被低估。他正确地指出了 AI 缺乏目标和责任感,但低估了其作为“能力放大器”在拓宽工程师解决问题边界方面的潜力。

最后,Oxide 的“全员同酬”模式面临规模化的终极考验。 在 85 人规模下,这一文化堪称典范。但当公司扩张至数百人,角色极度分化(如顶尖芯片架构师与初级支持工程师),维持绝对薪酬平等是否可能?抑或会演变为复杂的职级体系?Cantrill 强调招聘纪律和文化重要性,但未具体阐述应对规模化张力的机制。历史上,许多以独特文化著称的公司在规模扩大后都经历了文化的稀释或变形。

4. 行业视野

Cantrill 的叙事将 Oxide 置于一个宏大的行业周期与反抗叙事之中。

印证了“垂直整合”的周期性回归。 计算行业在大型机(垂直整合)、PC/客户端-服务器(水平分化)、移动互联网/云(再次分化)之后,似乎又出现了新的整合趋势:Apple 的软硬件一体、特斯拉的垂直整合、以及 hyperscaler 为自身需求定制芯片和服务器。Oxide 可被视为这一趋势在“企业云基础设施”领域的体现,试图将 hyperscaler 的内部优势产品化,提供给下游企业。

挑战了“软件吞噬世界”背景下对硬件创新的轻视。 在“一切即代码”、“基础设施即代码”成为主流的十年后,Cantrill 提醒我们,最终承载代码的仍是物理实体——服务器、电源、网络背板。当软件抽象遇到物理极限(功耗、散热、信号完整性、成本),深度的硬件创新变得不可或缺。Oxide 的故事是对“硬件已商品化”这一共识的直接反击。

它与开源硬件运动及 RISC-V 生态形成有趣的呼应与分野。 Oxide 将全部软件开源,但硬件设计并非开源。这不同于完全开源芯片设计的 RISC-V 生态。Cantrill 的选择更务实:利用开源构建信任和生态,但通过专有的硬件集成创造核心商业价值。这反映了在系统创新中,软硬件协同设计的复杂性可能使得完全开源在商业上不可行,但开放接口和软件栈仍是赢得开发者信任的关键。

与历史形成了“太阳(Sun)的幽灵”般的对话。 Oxide 常被比作 Sun Microsystems 的精神续作:对工程卓越的追求、软硬件一体化的理念、甚至对 Oracle 的批判都如出一辙。然而,Cantrill 明确表示不想重复 Sun 的所有错误。Oxide 生于云时代,商业模式是销售“可拥有的云”而非单纯硬件,并采用了远程优先、薪酬透明等 Sun 时代未曾有过的组织理念。这更像是一次基于历史教训的、有意识的现代化重构。

5. 启示与建议

这场对话首先挑战了一个普遍假设:技术进步总是伴随着资源丰裕和资本乐观。 它提醒我们,逆境和约束往往是突破性创新的催化剂。其次,它挑战了 “软件定义一切”意味着硬件无关紧要 的假设,揭示了在规模、效率和可靠性面前,硬件与软件的协同设计至关重要。

对于技术创业者与投资人:

  1. 关注“经济性断层”催生的机会。 仔细审视现有主导范式(如公有云)在哪些特定规模或场景下会出现经济性或控制权的断层。Oxide 瞄准了公有云成本与自有基础设施复杂性之间的断层。寻找类似的结构性矛盾,可能是发现新品类机会的关键。
  2. 在追捧 AI 的同时,重新评估深度系统与硬件领域的价值。 当所有人的注意力都集中在 AI 应用层时,支撑 AI 乃至所有数字服务的基础设施底层,可能因为人才和资本的相对稀缺而出现价值洼地。投资或创业于能够解决物理世界复杂性的“硬核”工程团队。

对于资深工程师与技术管理者:

  1. 有意识地利用或创造“约束”来驱动团队创新。 并非要追求经济衰退,而是在项目规划中,主动设置清晰的技术边界、资源限制或激进的质量目标,以模拟“绝望感”,迫使团队跳出惯性思维,寻求根本性解决方案。
  2. 在引入 AI 工具时,进行“问题分类”评估。 将团队面临的问题区分为:a) 模式明确、数据丰富的“在分布内”问题(如编写常见 CRUD API),AI 工具效率显著;b) 探索性、依赖物理交互或深度调试的“在分布外”复杂问题。对后者,应降低对 AI 的预期,并投资于培养团队的系统性思维、第一性原理分析和协作调试能力。

对于所有从业者: 重新思考薪酬与价值认同的关系。Oxide 的案例表明,极端透明的薪酬制度可以成为强大的文化信号和人才过滤器。虽然完全照搬可能不现实,但思考如何让薪酬体系更公平、更透明地反映公司价值观,可能有助于在竞争激烈的人才市场中构建独特的吸引力。

信号强度判断:

  • 强信号: Cantrill 关于 .com 泡沫前后创新对比的亲身经历、Oxide 在硬件调试中 AI 工具的无助、以及统一薪酬对招聘质量的影响,均基于具体、可验证的实例,可信度高。
  • 合理推断: “可拥有云”的市场规模、Kubernetes 成功源于云中立需求(而非纯技术)、以及“绝望驱动创新”作为普遍规律,这些是基于有限样本的归纳和商业判断,虽有洞见,但需结合更多案例谨慎评估。

6. 金句摘录

“We did much more technically interesting work in the bust than we did in the boom… There’s a degree to which innovation requires some level of desperation that good economic times are kind of hard to summon.” (我们在泡沫破裂后做的技术工作,远比在泡沫鼎盛时期做的更有趣……某种程度上,创新需要一定程度的‘绝望’,而好的经济时期很难唤起这种绝望。) 语境:反思 .com 泡沫时期与之后的技术工作质量对比,揭示繁荣可能扼杀深度创新。

“I cautioned people about anthropomorphizing Larry Ellison. You have to treat Larry Ellison as a machine — like a lawn mower. You stick your hand in the lawn mower, it’ll chop it off.” (我告诫人们不要拟人化拉里·埃里森。你必须把拉里·埃里森当作一台机器——像一台割草机。你把手指进去,它就会切断。) 语境:谈及 Oracle 收购 Sun 后的文化,用比喻尖锐地批评其冷酷无情的商业逻辑。

“Intelligence is not enough.” (智力不是万能的。) 语境:总结 Oxide 在硬件研发中遇到的、AI 工具完全无法解决的复杂调试问题,强调解决真实世界难题需要超越智力的品质。

“If you want to go build your own switch, I encourage you to have that attitude [that it’s simple] as long as you possibly can — because otherwise you won’t go do it.” (如果你想自己造交换机,我鼓励你尽可能长时间地保持那种[认为它简单的]态度——否则你根本不会开始去做。) 语境:解释 Oxide 决定自研网络交换机的决策过程,揭示了创业中必要的“乐观偏差”对于启动艰巨任务的关键作用。

“A prompt is not a goal and guessing the next word is not a goal.” (提示词不是目标,猜下一个词也不是目标。) 语境:区分当前 LLM 与真正具有目标的智能体,强调人类团队共同的使命感和求生欲才是驱动复杂工程项目的核心。