Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Aravind Srinivas: Perplexity CEO on Future of AI, Search & the Internet (2024-06-20, deepseek-chat)

1. 导读

本期播客的主角是Aravind Srinivas,Perplexity的联合创始人兼CEO。他并非一个普通的硅谷创业者,而是一位拥有DeepMind、OpenAI和Google研究背景的AI科学家。这种双重身份——既是前沿研究的亲历者,又是颠覆性产品的建造者——让他对“AI如何重塑信息获取”这一命题的解读,既有技术上的穿透力,又有商业上的现实感。

对话发生的时点尤为关键。一方面,以ChatGPT为代表的生成式AI已证明其作为通用界面的潜力,但“幻觉”问题使其在严肃信息获取场景中仍显脆弱;另一方面,谷歌的搜索广告帝国看似稳固,但其商业模式与提供“直接、无偏见的答案”之间存在根本性张力。Srinivas正是在这个裂缝中,提出了一个看似简单却极具颠覆性的论点:未来的知识引擎不应是链接的列表,而应是像学术论文一样、每一句都有引证的“答案”。这场对话的价值,不仅在于理解一个明星创业公司的产品逻辑,更在于窥见一个可能被重构的互联网信息生态,它将直接影响内容创作者、广告商、投资者乃至每一个信息消费者的决策逻辑。那么,一个由AI驱动、以“引证”为基石的答案引擎,真能挑战谷歌长达二十年的统治,还是会沦为又一个被巨头轻易复制的功能?

2. 核心观点

Aravind Srinivas的核心世界观是:互联网信息获取的范式正从“链接检索”转向“知识发现”,而实现这一转变的关键,不是单纯依赖更强大的大语言模型(LLM),而是构建一个将传统搜索的严谨性与LLM的叙事能力深度耦合的系统。这一世界观挑战了“模型能力决定一切”的行业共识,也质疑了谷歌以链接和广告为核心的商业模式的长期可持续性。

“引证”是解决AI幻觉的工程学原则,而非临时补丁。 Srinivas断言,强制LLM像学术写作一样为答案中的每一句话提供引用,是当前确保信息可靠性的最有效方法。这一原则源于其学术背景(“论文中每一句话都应有出处”),并已内化为Perplexity产品的核心架构——检索增强生成(RAG)系统被严格限定只能基于检索到的文本来生成答案。这并非等待“更聪明的模型”来解决问题,而是一种主动的工程约束,将准确性责任从单一的模型能力,分摊到了检索、索引、呈现的全链路系统上。

颠覆搜索巨头的方式是“重新发明UI”,而非在相同维度上做得更好。 他认为,试图在“10个蓝色链接”的框架内超越谷歌是徒劳的,因为谷歌已在此领域深耕二十年。真正的机会在于彻底翻转用户界面(UI)的优先级:将“答案”而非“链接”置于最突出的位置。Perplexity早期曾就是否保留侧边栏链接有过激烈争论,最终他们选择赌注模型和索引技术会指数级改进,幻觉将越来越难被发现。这种“激进简化”的UI策略,瞄准的是谷歌因高利润广告业务而无法全力投入的“弱点”。

未来的竞争壁垒在于“领域知识”,而非“模型所有权”。 Srinivas强调,构建一个优秀的答案引擎需要海量的领域知识(Domain Knowledge),例如如何高效爬取和渲染网页、如何混合BM25等传统检索算法与向量嵌入、如何根据不同查询类别动态调整排名信号(如时效性、权威性)。这远非一个“模型包装器”所能解决。因此,Perplexity虽然也基于Llama 3训练了自己的模型Sonar,但其战略定位是“模型无关的”——核心价值在于那个融合了复杂领域知识的系统,而非某个特定模型的权重。

AGI突破的关键将是“推理计算”,而非“训练计算”。 他提出了一个关于AGI演进方向的深刻见解:真正的推理突破可能不体现在模型参数量的增长上,而体现在“推理计算”(Inference Compute)的规模化应用上。他设想的场景是:AI能像爱因斯坦一样,面对难题时说“我不知道”,然后消失进行长达一周的研究,最终带回令人震撼的答案。这种需要消耗大量计算资源进行长期、迭代式思考的能力,一旦实现,将标志着“真正推理”的开始,并可能使“计算资源的可及性”而非“模型权重”成为新的权力中心。

商业模式的创新源于对“敌人弱点”的战略利用。 在分析谷歌的AdWords时,Srinivas引用了《孙子兵法》和贝佐斯的“你的利润就是我的机会”。他指出,谷歌的弱点在于,任何利润率低于点击广告、或可能减少链接点击的广告单元,都与其核心利益冲突。因此,Perplexity可以探索订阅制或新型广告形式(如Instagram式原生广告),这些模式对谷歌而言是“低优先级”的,但对初创公司却是可行的生存与发展空间。这体现了其不追求复制“史上最伟大商业模式”,而是构建“一个好生意”的务实态度。

人类“好奇心”是AI无法替代的终极价值。 在技术乐观主义之外,Srinivas为人类保留了一个特殊位置:好奇心。他认为,即使AI未来能像费曼一样深入研究问题,也难以模仿人类那种自发的、探索性的好奇心。因此,Perplexity的使命不是替代人类思考,而是通过产品设计(如自动生成相关追问)来激发和辅助人类的好奇心旅程,让知识发现成为一个没有终点的、无限扩展的过程。

这些观点构成了一个逻辑闭环:以“引证”原则构建可靠系统,以“新UI”开辟差异化战场,以“领域知识”建立深层壁垒,并最终服务于“人类好奇心”这一永恒主题。同时,他对推理计算和商业模式的思考,又将这场关于搜索的讨论,引向了关于AGI本质和科技公司竞争哲学的更宏大图景。

3. 批判与质疑

Srinivas的论述体系锐利且自洽,但仍有几处依赖未经充分验证的前提或存在被忽略的风险。

首先,“引证即真实”的假设过于理想化。强制引用网络来源固然能减少“无中生有”的幻觉,但无法解决“来源本身的质量与偏见”问题。互联网信息并非纯净的真理集合,而是充斥着矛盾、营销内容和意识形态斗争。Perplexity的排名算法如何确保其检索和采信的“真相”是客观的?当面对“新冠起源”这类高度争议性话题时,其系统很可能只是聚合并复述了网络上已有的、相互冲突的观点,而无法像Srinivas所期望的那样,通过“推理计算”得出超越人类现有认知的、更接近本质的结论。这本质上将判断信息可信度的责任,从LLM转移到了其检索和排名系统上,而后者同样可能被SEO(搜索引擎优化)或新兴的AEO(答案引擎优化)所操纵。

其次,对“模型进步将指数级减少幻觉”的赌注存在技术乐观主义风险。Srinivas承认存在长尾幻觉,但认为会越来越难被发现。然而,LLM的幻觉问题有其本质根源(如自回归生成的特性、训练数据偏差),并非单纯靠扩大规模就能根除。同时,用户对“答案引擎”的容错率远低于对“聊天机器人”。一次关键事实的误报就可能导致信任崩塌。将产品核心体验建立在“模型会越来越好”的假设上,是一把双刃剑。

再者,其商业模式相对于谷歌的“低利润率”特点,既是机会也是天花板。订阅制和小规模创新广告能否支撑起一个需要持续投入天量计算资源(用于索引、检索和推理)的全球性知识引擎?Netflix和Spotify的内容成本是相对固定的,而Perplexity的“答案生成成本”却随查询量和复杂度线性增长。如果无法达到谷歌的规模效应,其单位服务成本可能始终居高不下,使“可持续的好生意”面临严峻的财务挑战。

最后,对话中悬而未决的核心问题是:当Perplexity从“答案提供者”迈向“知识发现引导者”时,其“引导”的边界在哪里? 自动生成相关问题的算法,本质上是在塑造用户的探索路径。这赋予了平台巨大的隐性权力——决定什么是“值得探索”的。如何确保这种引导是开放、中立且促进批判性思维的,而非陷入信息茧房或某种商业目的的软性引导?这比提供有引证的答案更为复杂和敏感。

4. 行业视野

Srinivas的思考并非孤例,而是与行业内的几股重要思潮相互印证并形成张力。

首先,他的理念直接呼应并挑战了谷歌自身的“AI-first”转型困境。谷歌早在十年前就通过知识图谱提供“即时答案”,但受制于其“摇钱树”广告业务,始终无法将生成式答案作为默认界面。Perplexity可被视为将谷歌内部可能存在的、但因商业原因被压抑的技术路线图,外化为了一个独立产品。这与微软将Bing Chat(Copilot)置于Windows核心位置的激进姿态形成对比,代表了挑战搜索霸权的另一种“轻骑兵”路径。

其次,他对“领域知识”和“系统工程”的强调,挑战了当前AI创业中“唯模型论”的浮躁风气。在许多创业者热衷于基于GPT-4 API做简单包装时,Perplexity深入爬虫、索引、混合检索系统的做法,回归了古典互联网时代的工程精神。这印证了一个趋势:AI价值的最终兑现,越来越依赖于与垂直领域深度结合的、复杂的系统工程,而非单纯的模型调用。

再者,他将Yann LeCun关于“自监督学习是蛋糕,监督学习是糖霜,强化学习是樱桃”的比喻,创造性地应用到了产品架构中。他将LLM的预训练视为“蛋糕”,监督微调(SFT)和RAG等后训练技术视为“糖霜”,而复杂的多步推理和工具调用则是“樱桃”。这体现了他将前沿研究洞察迅速工程化的能力,也反映了当前AI发展从“预训练规模竞赛”向“后训练精雕细琢”阶段过渡的行业共识。

最后,他对“推理计算”重要性的预测,与AI研究界对“思维链”(Chain of Thought)和“自洽性”(Self-Consistency)等技术的重视一脉相承。他参与的STaR(自洽性推理自举)研究,正是试图让模型通过自己的推理结果来迭代改进。这指向了一个可能的新范式:未来AI能力的瓶颈,或许不在于训练数据的多寡,而在于能否高效、低成本地进行“反复思考”。这与早期AI发展依赖“数据”和“算力”双螺旋的范式有所不同。

5. 启示与建议

这场对话挑战了一个根深蒂固的假设:即“更好的搜索”等同于“更精准的链接排序”。它强化了另一个假设:“答案的终点”应是“好奇心的起点”。

对于创业者与产品经理

  1. 寻找“高利润者的盲区”:仔细分析行业巨头的核心利润来源,寻找那些对其而言“食之无味”(低利润率或损害核心体验)、但对新进入者却是“生存之基”的领域。不要试图在对方的主场硬碰硬。
  2. 将学术原则工程化:像Perplexity将“学术引证”转化为产品核心架构一样,尝试从其他成熟领域(如出版、教育、法律)中提炼出经过时间考验的原则,并将其转化为AI时代的新产品逻辑。

对于投资者与行业分析师

  1. 评估“领域知识”壁垒:在考察AI应用公司时,除了关注其使用的模型,更要深入评估其在特定垂直领域(如搜索、医疗、法律)构建的数据管道、混合算法系统与领域专属优化。这些“脏活累活”往往是更可持续的护城河。
  2. 关注“推理成本”曲线:将“单次查询推理成本”和“延迟”列为评估AI基础设施和模型提供商的关键指标。未来,能显著降低复杂推理任务成本的技术或架构,可能比单纯的模型性能提升更具投资价值。

对于内容创作者与出版商

  1. 为“答案引擎优化”做准备:传统的SEO策略可能逐渐失效。需要思考内容如何能被AI更好地理解、摘要和引用。确保网站信息的结构性、准确性和时效性,可能比追逐流量关键词更为重要。
  2. 重新审视与平台的关系:在“答案即界面”的世界里,用户可能越来越少点击进入原始网站。需要探索在Perplexity Pages这类新范式下,如何既能通过AI扩大知识传播,又能维护品牌价值和可持续的商业模式。

Srinivas关于“引证系统有效性”和“UI范式转移必要性”的论述是基于Perplexity实践经验的强信号。而关于“推理计算驱动AGI”和“好奇心不可替代”的论断,则是富有洞见的合理推断,其实现路径和时间表仍需观察。

6. 金句摘录

  1. “Your margin is my opportunity.” (Jeff Bezos) (你的利润就是我的机会。) 语境:Srinivas引用贝佐斯的名言来解释其竞争哲学——巨头因高利润业务无法全力投入的低利润率领域,正是创业公司的机会所在。

  2. “We do not have to beat them, neither do we have to take them on… The disruption comes from rethinking the whole UI itself.” (我们不必打败他们,也不必正面交锋……颠覆来自于重新思考整个用户界面本身。) 语境:当被问及Perplexity能否挑战谷歌时,他清晰地划定了战场:不是优化旧范式,而是创造新范式。

  3. “The cake is unsupervised learning, the icing is supervised fine-tuning, and the cherry on the cake is RLHF.” (蛋糕是自监督学习,糖霜是监督微调,蛋糕上的樱桃是RLHF。) 语境:他借用Yann LeCun的比喻来解构现代大语言模型的成功配方,强调了不同技术组件的主次关系。

  4. “Can you have a conversation with an AI where it feels like you talked to Einstein or Feynman, where you ask them a hard question, they’re like, ‘I don’t know,’ and then after a week, they did a lot of research and come back and just blow your mind.” (你能和AI进行这样的对话吗?感觉就像在和爱因斯坦或费曼交谈,你问一个难题,他们说‘我不知道’,然后一周后,他们做了大量研究回来,让你大吃一惊。) 语境:这是他对于“真正推理”的具象化描述,指向了AI能力演进的一个关键里程碑。

  5. “The user is never wrong.” (用户永远没错。) 语境:他阐述从拉里·佩奇那里学到的产品哲学,强调产品应理解用户的模糊意图,而非要求用户成为“提示词工程师”,这奠定了Perplexity追求极致易用性的基础。