Google: The AI Company: The Complete History and Strategy (deepseek-chat)
1. 导读
本期播客《Acquired》以罕见的深度和广度,重构了谷歌作为“AI公司”的完整叙事。两位主持人Ben Gilbert和David Rosenthal并非泛泛而谈,而是通过大量一手访谈(包括与Sundar Pichai、Jeff Dean、Demis Hassabis、Sebastian Thrun等关键人物的对话)和历史文献,揭示了一个被公众熟知却又充满误解的真相:谷歌不仅是当今AI浪潮的奠基者,更可能是唯一集齐了“模型、芯片、云、应用”四大核心资产的玩家。然而,节目最引人入胜的张力在于,谷歌正深陷于科技史上最经典的“创新者窘境”之中——其赖以生存的、利润丰厚的搜索广告业务,恰恰可能成为其全面拥抱AI时代、重塑自我的最大障碍。这场对话不仅关乎一家公司的命运,更将深刻影响开发者、投资者乃至整个数字生态的竞争格局。
2. 核心观点
谷歌的核心世界观是:人工智能并非一个独立的新兴业务,而是其自创立之初就刻入DNA的终极使命——“组织世界信息”的自然延伸与最高形态。这一世界观之所以充满争议,是因为它要求谷歌在AI带来的“破坏性创新”面前,必须冒着颠覆自身“现金牛”业务的风险,去拥抱一个单位经济效益远不如搜索的未知未来。
语言模型是谷歌的“元技术”,其价值远超单一产品。 早在2001年,工程师Noam Shazeir和Gor Héric就在午餐闲聊中提出了“数据压缩即理解”的理论,这直接催生了早期语言模型“Phil”。该模型不仅优化了“您是不是要找”的拼写纠错功能,更成为AdSense理解网页内容、匹配广告的核心引擎,为谷歌创造了数十亿美金的新收入。这证明,语言模型并非炫技的研究,而是能直接驱动核心利润的底层技术。
谷歌的AI优势根植于其将前沿研究工程化、规模化的独特能力。 2007年,Jeff Dean将翻译团队耗时12小时的神经网络模型优化至100毫秒,并成功部署到Google Translate中。这一案例的深层逻辑是,谷歌拥有将学术突破(如Jeff Hinton的深度学习理论)与自身世界级的、高度并行化的数据中心基础设施相结合的能力。这种“研究-工程-产品”的快速闭环,是其在2012年后将AI深度融入搜索、广告、YouTube推荐等所有核心业务,并创造数千亿美金价值的关键。
“Transformer”的诞生与“流失”,是谷歌创新体系优势与僵化并存的集中体现。 2017年,谷歌大脑团队发表了划时代的《Attention Is All You Need》论文。团队内部(如Noam Shazeir)已意识到其革命性潜力,甚至主张用Transformer彻底重构搜索。但谷歌庞大的既有业务(高利润的搜索广告、与出版商的复杂关系、用户对准确性的极高信任)构成了巨大的转型阻力,导致其未能第一时间将这一技术产品化为面向大众的聊天界面。讽刺的是,这一“开放”的学术发表,直接催生了OpenAI和整个外部AI创业生态。
收购DeepMind是谷歌为“通用人工智能”押下的战略性赌注,其回报远超财务范畴。 2014年,谷歌以5.5亿美金收购DeepMind,看中的是其“解决智能,再用智能解决一切”的纯粹研究使命。谷歌的独特价值在于,它拥有Google Brain来负责AI的产品化,因此可以允许DeepMind保持研究独立性,并为其提供近乎无限的算力资源。这笔交易不仅带来了AlphaGo等里程碑,其更深远的影响是间接刺激了Elon Musk的危机感,从而催化了OpenAI的创立,彻底改变了AI竞争的格局。
TPU(张量处理单元)是谷歌应对AI算力挑战的“非对称武器”,其经济学意义可能被低估。 当谷歌意识到神经网络的算力需求可能使其数据中心规模翻倍时,其选择不是完全依赖英伟达GPU,而是用15个月时间自研了专为矩阵乘法优化的TPU。其核心洞察是使用“降低计算精度”来换取极高的能效比。关键在于,TPU让谷歌避免了向英伟达支付高达80%的毛利率(即“Jensen税”),使其在运行海量AI推理(如搜索中的AI概述)时,拥有潜在的低成本结构优势。
谷歌当前的战略核心是“保护核心”与“激进创新”的危险平衡。 在ChatGPT引发“Code Red”后,桑达尔·皮查伊做出了两项关键决策:一是合并Google Brain和DeepMind为Google DeepMind,结束内耗;二是确立“Gemini”为统一的基础模型,要求全公司产品线集成。这背后的逻辑是,在AI的“规模定律”下,集中资源训练一个巨型模型,其效能和成本远优于维护多个模型。谷歌正在尝试一种精妙的舞蹈:通过“AI概述”部分查询、对部分用户开放“AI模式”,而非直接将Google.com重定向至Gemini,以期在不大幅蚕食搜索广告收入的前提下,培育新的AI业务。
这些判断勾勒出谷歌AI战略的内在矛盾:它拥有从理论(Transformer)到硬件(TPU)再到应用(搜索入口)的全栈优势,但其最大的敌人正是自己创造的、史上最成功的商业模式。能否解开这个死结,将决定它是在AI时代延续霸权,还是成为“创新者窘境”的终极教科书案例。
3. 批判与质疑
嘉宾的论述体系虽然有力,但建立在几个未经验证或过于乐观的前提之上。
首先,“全栈优势必然转化为胜势”的逻辑存在漏洞。拥有模型、芯片、云和应用,固然意味着不受制于人,但也可能导致“创新盲点”和“路径依赖”。历史上,拥有垂直整合优势的巨头(如IBM、微软在PC时代)也曾在平台转换期被更灵活、更专注的对手挑战。谷歌的TPU生态能否在开发者体验和工具链上超越已成气候的CUDA生态,仍是一个巨大的问号。节目中提到TPU可能通过第三方云服务商提供,这本身就暗示了其生态扩张的迫切性与挑战。
其次,对AI商业模式过于乐观,低估了价值捕获的难度。嘉宾指出AI查询包含更多意图信息,理论上应比搜索更容易变现。但这忽略了用户体验与商业化的根本冲突:用户期待的是一个直接、无干扰的答案,而广告的本质是中断与引导。谷歌在搜索中 perfected 的“意图-广告”匹配模式,在对话式、长文本的AI交互中能否无缝移植,尚未被证实。目前Gemini的4.5亿月活用户,其货币化程度与搜索相比可能微不足道。
再者,“统一模型(Gemini)战略”可能是一把双刃剑。集中力量办大事在理论上高效,但也可能扼杀产品团队针对特定场景进行模型微调和创新的灵活性,重蹈“Google+”式内部强推的覆辙。此外,将公司命运过于系于单一技术路线(即Transformer架构的持续缩放),也忽视了基础研究出现新范式的风险。
最后,对话中一个悬而未决的核心问题是:谷歌的“创新者窘境”在多大程度上是技术或商业问题,而在多大程度上是文化与组织问题? 节目揭示了早期谷歌那种“20%时间”、工程师驱动的无政府主义创新文化,如何催生了PageRank、Gmail乃至Transformer。而如今庞大、成熟、风险厌恶的谷歌,是否还能容忍像Noam Shazeir那样“停止手头一切工作去钻研一个疯狂想法”的行为?文化基因的演变,可能比商业模式的权衡更能决定谷歌的AI未来。
4. 行业视野
这场对话将谷歌置于两个更大的叙事框架中,使其战略选择的意义更加清晰。
其一,印证了“AI基础设施竞赛”已成为巨头游戏的核心。谷歌的AI史与微软、亚马逊、Meta的路径形成了鲜明对比。微软选择与OpenAI结盟,以资本和云换取技术;亚马逊坚守云基础设施之王的位置;Meta则全力押注开源模型和应用生态。谷歌是唯一选择“全栈自研”路线的巨头。这标志着一个共识:AI不仅是应用层的创新,更是计算范式、硬件架构和能源消耗的全面竞赛。谷歌的TPU战略,直接挑战了英伟达在AI算力领域的统治地位,预示着未来AI产业链的权力结构可能更加复杂和多极化。
其二,挑战了“初创公司是颠覆性创新唯一来源”的硅谷迷思。OpenAI、Anthropic的故事固然激动人心,但谷歌的叙事表明,拥有长期技术储备、庞大工程团队和无限资本的大型企业,同样可以成为(甚至是更主要的)根本性突破的源泉。Transformer的诞生于谷歌大脑,以及谷歌在将深度学习工程化、规模化上取得的成功,都说明了“持续性创新”与“颠覆性创新”的边界在AI时代可能变得模糊。大公司既能成为创新的摇篮,也可能成为其成果的“埋葬者”。
其三,与互联网早期历史形成了意味深长的呼应。谷歌在21世纪初作为挑战者,用更优的算法(PageRank)和干净的界面颠覆了雅虎等门户网站。如今,它自己成为了那个拥有90%市场份额、商业模式根深蒂固的“门户”。OpenAI等新玩家正试图用更自然的交互方式(聊天)来颠覆“10个蓝色链接”。历史不会简单重演,但其中的结构性张力如出一辙:更好的用户体验 vs. 成熟的盈利模式,开放 vs. 控制,初创公司的敏捷 vs. 巨头的资源。
5. 启示与建议
这场对话最值得重新审视的假设是:“AI的商业化路径必然遵循互联网或移动互联网的范式”。谷歌的困境表明,AI创造价值的方式(深度理解与生成)与捕获价值的方式(广告、订阅)之间,可能存在比过去更大的鸿沟。
对于投资者:应摒弃简单的“颠覆者 vs. 被颠覆者”叙事,转而关注“单位经济效益”和“生态控制力”。重点关注谷歌如何利用其TPU成本优势,以及其将AI功能“编织”进现有产品矩阵(如搜索、Workspace、YouTube)的能力,观察其AI收入是作为新的增长曲线出现,还是仅仅作为维持核心业务竞争力的成本项。对OpenAI等独立模型公司的评估,则需高度关注其现金消耗率与实现自我造血能力的时间表。
对于创业者与开发者:认识到“全栈时代”的挑战与机遇。在模型、芯片、云均被巨头把持的战场上,直接进行基础层竞争异常艰难。更可行的路径是:1)深度利用巨头生态的差异化部分:例如,基于谷歌的Gemini模型和其独有的YouTube/地图数据,构建垂直场景的AI应用;2)专注于巨头无法或不愿做的“最后一公里”:如高度定制化的企业工作流集成、特定领域的精调与安全合规解决方案。避免陷入“又一个通用聊天机器人”的竞争红海。
对于大型科技企业的管理者:谷歌的案例是一份关于如何管理“战略矛盾”的活教材。建议是:1)建立独立的“颠覆性创新”单元并给予真正的自主权,如早期的Google X和DeepMind,但其技术成果必须有强制性的、与核心业务部门的对接与转化机制。2)将基础设施能力(如TPU、数据中心网络)本身视为可对外服务的产品,即使短期内会帮助竞争对手,但长期能构建生态和标准。3)对“开放”与“封闭”进行动态、精细的权衡,Transformer论文的发表是代价高昂的教训,但完全封闭也可能扼杀创新和人才吸引力。
结论的信号强度:谷歌拥有AI全栈资产和现金流优势是强信号,有大量财务和产品数据支撑。其面临的“创新者窘境”及商业模式挑战也是强信号,源于其公开财报和战略动作。而关于TPU成本优势最终将转化为市场胜势、以及Gemini统一模型战略必然成功的判断,目前仍属于合理推断,需要未来几个季度的财务表现和市场份额数据来验证。
6. 金句摘录
“Sanjay thinks it’s a good idea and no one in the world is as smart as Sanjay. So why should Noam and I accept your view that it’s a bad idea?” (“Sanjay觉得这是个好主意,而世界上没有人比Sanjay更聪明。那么Noam和我为什么要接受你认为这是个坏主意的观点呢?”) 语境:2001年,工程师Gor Héric和Noam Shazeir决定投身语言模型研究,面对内部质疑时,他们用谷歌传奇工程师Sanjay Ghemawat的认可作为终极辩护。这句话 encapsulates 了早期谷歌工程师文化中,技术权威与精英主义驱动创新的精神内核。
“I felt like there were risks involved, but I also felt like it would be a very interesting thing to try.” (“我觉得这其中存在风险,但我也觉得,尝试这件事会非常有趣。”) 语境:2015年,在Elon Musk和Sam Altman组织的一场晚宴上,当被问及是否愿意离开谷歌加入一个新的AI非营利实验室时,Ilya Sutskever(后来的OpenAI联合创始人兼首席科学家)如此回应。这句冷静而充满好奇心的话,预示了顶级AI研究人才心态的转变,以及OpenAI诞生的关键一刻。
“We want people to know that we made Google dance.” (“我们想让人们知道,我们让谷歌跳舞了。”) 语境:2023年2月,微软CEO萨提亚·纳德拉在宣布推出由OpenAI技术驱动的“新必应”时所说。这句话充满了复仇的意味和战略宣告,标志着微软在搜索领域沉寂十余年后,首次利用AI技术获得了对谷歌进行实质性挑战的武器,也精准地刺痛了谷歌的神经。
“The trouble was so many of the people most qualified to solve these problems were already working for Google.” (“问题在于,最有资格解决这些问题的人,大多已经在为谷歌工作了。”) 语境:引自记者Cade Metz对2015年那场决定OpenAI命运的晚宴的描述。这句话深刻地揭示了当时AI人才分布的极端集中性,以及谷歌在AI崛起前夜所拥有的、近乎垄断的人才壁垒,这也反衬出后来人才流失的严重性。
“If we had the ultimate search engine, it would understand everything on the web. It would understand exactly what you wanted and it would give you the right thing. That’s obviously artificial intelligence.” (“如果我们拥有终极搜索引擎,它将理解网络上的一切。它将确切理解你想要什么,并给你正确的东西。这显然就是人工智能。”) 语境:2000年,谷歌联合创始人拉里·佩奇对公司使命的阐述。这句话是贯穿整个谷歌AI史的“文眼”,表明谷歌从诞生起就将AI视为其搜索业务的终极形态,而非一个后来的附加功能。它既是谷歌AI野心的源头,也为其今日面临的“创新者窘境”埋下了伏笔。