Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

陶哲轩:数学、物理中最难的问题以及人工智能的未来 (2025-06-15, glm-4.7-flash)

1. 背景与价值

Terence Tao,被誉为史上最伟大的数学家之一,不仅因其对调和分析、偏微分方程及数论的深刻贡献而享有盛誉,更因其独特的**“狐狸型”(Fox)**人格和跨学科洞见而备受推崇。当他从思维加密的象牙塔走入与 Lex Fridman 的对话时,这场谈话的价值在于它触及了智力生产的“根基性变革“。

由于认知带宽的稀缺,我们往往关注应用层的创新(如 LLMs 或金融算法),却忽略了底层逻辑的物理与数学约束。这一次对话的价值在于,它指出了当我们在处理复杂的非线性系统(如流体动力学、费马大定理或高维金融模型)时,核心的瓶颈不在于算力,而在于两种对立的发现范式:经典的演绎法和新兴的“计算实验法“(Checked but not Verified)。Tao 正处于这两者的交汇点,他试图用量化的严谨性去消解“模糊的直觉“,这直接挑战了“科学仅仅是分类数据的经验主义“这一陈旧观点。

嘉宾的核心世界观建立在**“数据压缩即真理”“有限集合中零存整取”**的二元论上。他认为宇宙并非偶然的噪音,而是一套高度压缩的数据集,数学则是解压缩的特定技艺。更具争议性的论点是:人类数学观正处于从“单一英雄叙事“向“分布式共识计算“的范式转移中,但这并非全然的进步,其中关于“随机性分析“的局限性仍是乐园的墙壁。

2. 核心观点

2.1 “作弊“是一种强力的负面验证策略 Terence Tao 断言,解决超难问题(如 Navier-Stokes 方程的奇异性)的唯一途径是反向思考。他不采取通常的“正向求解“路径,而是通过构建“作弊版“方程——人为修改物理规则,设定规则使其必然崩溃或无法求解——来已识障碍,证明常规路径的无效性。这一推论的底层逻辑是:真实的 Navier-Stokes 方程拥有完美的对称性和守恒律,如果我的破坏性模型(保留了非线性但禁用了守恒律)能导致崩溃,那么真实的方程正守恒律必然限制了崩溃的发生。这为公司风险管理提供了类比:与其惊慌于潜在的火烧连营,不如预先构造极端场景来验证反赌策略的有效性。

在对话中,Tao 以 2016 年的论文成果为例,他通过“平均 Navier-Stokes“方程构建了一个破坏性张量,证明了其指数级发散的必然性,从而排除了部分常规的分析路径。这与他现场演示的玩弄特定组件构建“空气闸门“(airlocks)以确保能量仅向单一路径转移的工程类比相呼应。这四个观点的张力在于:要解决预测性问题(如天气或流体),必须容忍不能完全确定性解释的混沌;而要证明安全性,则必须在不可证之处通过构造特例来发现边界。

2.2 “比随机更难随机“的哈密顿恶魔悖论 Tao 提出了一个关于“随机性“的革命性观点:证明某事物不是随机的,往往比证明它是随机的要难得多。这源自 Twin Prime (孪生素数) 猜想和 Riemann Hypothesis (黎曼猜想) 的困境。他认为,虽然统计学证据强烈支持素数分布服从随机模型,但数学工具目前只能处理“有大偏移量的随机”,而对于“完全随机“(即平方根级震荡)的证明无能为力。

其逻辑链条是:如果素数分布像随机集合,我们有很多工具;但如果它遵循某种反直觉的结构,目前的分析工具会失效。退一步讲,最大的困难在于证明“不存在恶意阴谋“(Maxwell’s Demon 范式)。例如,是否存在一种极其精细的概率模型,专门剔除所有素数对,但对观察者来说完全无法察觉?Tao 称之为“Conspiracy Mapping“(阴谋图集)。结论表明,数学的进展受制于我们对“负面结果“(即证明某事物不可能发生)的工具匮乏。

2.3 宇宙即压缩数据:理清观察与现实的鸿沟 Tao 从物理学视角重新定义了数学的本质,将其确立为对观察数据(Reality -> Observations)的极致压缩。他认为好的理论模型不应该像拼凑的皮肤,而应该像一把万能有字的钥匙,在极其少的参数下解释庞大的数据集。他引用了暗物质模型(14个参数解释海量天文观测)与失败的常微分模型(10个参数解释10个数据点)的区别。

这个断言的价值在于揭示了当前数据科学的通胀泡沫:未经压缩、参数过多的模型本质上是过拟合。 Tao 提出的核心矛盾是,我们目前仍缺乏一套数学工具来从量子尺度的微观相互作用(往往涉及比特数爆炸)中提炼出既符合广义相对论又符合量子力学的“统一语言“。他提到的 universality(普适性)是一个关键支点:为什么像气体分子这样大量相互作用的小个体,其宏观行为(如温度压力)会收敛到简单的公式?理解这一点,才是打破物理建模僵局的关键。

2.4 跨模态迁移:从 Game of Life 到流体计算 Tao 指出,数学的极致统一性在于它能映射到所有离散与连续系统。通过对比 Conway 的 Game of Life(生命游戏)与 Navier-Stokes 方程,他揭示了一个令人战栗的可能性:连续的流体方程中可能内嵌了计算能力。Tao 的最新险思是为了证明 Navier-Stokes 的奇异性,构想了一台“水造计算机“,利用流体自身的涡环作为逻辑门(AND/OR),利用 von Neumann 自我复制机器原理,让能量在微型化迭代中螺旋升亿。

这一观点与 AI 辅助逻辑形成了逻辑共振:如果离散的元胞自动机可以模拟真实流体,那么连续的物理场可能本身就是未来“材料科学计算机“的载体。内在张力在于:流体是天然屌丝,粘性会耗散能量,而脆弱的电子器件不会。如何在物理定律的限制下构建能抵抗阻尼的计算架构,是 Turing 计算机的自然升级版。

2.5 协作范式转移:“原子化“数学实验 Tao 提出了对数学研究组织形式的风险预判。传统的“手搓数学“意味着决策滞后和个人脱水,而现代工具(Lean 编程语言)正在通过原子化协作重塑生产力。他透露了正在进行一个包含 22 万万道抽象代数命题的挑战——“Equational Theories Project”,由约 50 人共同完成,利用 Lean 将所有代数法则进行形式化验证并判定蕴含关系。

这一主张的根基在于重构研究者的激励机制。传统的同行评审无法处理超过百人的贡献,而“原子化“的代码贡献使得贡献可溯源、可验证,从而允许大规模的分布式协作。Tao 认为,数学正在从孤独的探索变成一个人的协作网络。这种转变的核心逻辑是:验证层级(Verification)的自动化(由 Lean 提供)将下降至零成本,而抽象层级(Generation)和直觉层级(Inspiration)将保持珍贵。这意味着未来可能诞生非人类智能(如 AI)主导的初步计算验证,而人类专家则专注于否证和提出新范畴。

3. 批判与质疑

尽管 Tao 的洞见极具前瞻性,但在将其应用于现实决策时,必须警惕几个未经反思的前提和逻辑盲区:

  1. 过拟合的“随机性“陷阱:Tao 指出很难证明宇宙是随机的,但将此引申为“任何结论我都预设为阴谋论“是一种哲学上的偷懒。虽然想要用数学工具证明 Twin Prime 的随机性很困难,但这并不代表机制主义(Structure)解释就比随机模型更合理。在许多工程场景中,忽略微观结构(如塔科夫的 Collatz 猜想)而依赖统计特性往往能获得尚可的结果,盲目追求对“负面情况“的排除可能导致研究瘫痪。Tao 自己也承认数学中某些更有趣的结构往往来自“精心设计的反直觉初始条件“。
  2. “理想化“的不可实现性:在讨论流体计算或大统一理论时,Tao 谈到了将流体视为 von Neumann 自我复制机制的可能性。然而,他明确指出这是一个“pipe dream”(白日梦)。这种思想实验虽然有趣,但在现实中面临着巨大的阻抗匹配问题:流体对噪声极度敏感,而数字逻辑对噪声免疫。如果没有精确的误差修正机制,基于液体的计算将因黏度降级而失去意义。将思想实验的产物当作实质性的工程路线图是有风险的。
  3. “AI 协作“中的信任黑箱:Tao 提倡利用 AI(如 GitHub Copilot)辅助数学写作,但忽略了当代码生成率高达 50% 甚至 100% 时的安全隐患。当 AI 生成一段看似完美但存在致命逻辑漏洞的证明时,即使是天才(如 Tao)也难以瞬间察觉。这种“伪确定性“在关键系统中是致命的。此外,他对 “conspiracy mapping” 的恐惧也被 AI 的幻觉问题放大——如果人类数学家都对“负面结果“的排除感到无力,训练 AI 仅在“正向证据“上行驶(如目前 LLM 的训练机制),我们将如何教会系统去识别那些“证据不足的失败分支“?
  4. 群体智慧的局限性:Tao 推崇由 50 人或更多人协作的原子化数学,但这暗示了“人多力量大“并不总是成立的。数学往往需要高度的专注和思维隔离(如 Andrew Wiles 隐居 7 年)。大规模协作往往导致结果的平庸化与碎片化,为了适应协作流程,真正的原创性思想往往被牺牲。Quadratic Inflation(平方爆炸)不仅仅适用于计算,也适用于认知的混乱。

4. 行业视野

这场对话并非孤立存在,它与当前的技术思潮构成了一个清晰的坐标系:从“数值验证“向“形式验证“的军备竞赛

与以往的研究不同,Tao 早年对 Navier-Stokes 的研究意味着纯粹的物理直觉在亚秒级模拟失效,而近期对 Lean 的拥抱则标志着“代码即定理“的确立。这在行业内预示了三个关键趋势:

  • 学术基础设施的固化:就像 Google 早期标准化了网页排序协议一样,Lean 和 Mathlib 正在成为未来数学论文的 Linux 内核。任何深研究若不走这一条流水线,产出将被视为过时。
  • 通用智能涌现的生物学隐喻:Tao 对 Game of Life 的引用与当前强化学习(RL)寻找稀疏奖励信号的研究遥相呼应。两者都在试图理解:是否存在某种极其简单的演化规则,却能涌现出复杂、聪明的行为?这对 AI 模型的设计范式有启示。
  • 历史理论的复兴或消亡:Tao 谈及 Perelman 对数学荣誉的隐退,暗示了学术评价体系的脆弱性。随着专业参与的门槛降低和大规模验证工具的普及,诺贝尔奖、菲尔兹奖的传统光环可能会被 GitHub 贡献数或算法验证成功率所稀释。学术界正在从“英雄崇拜“向“开源贡献“转型,这可能会打破高深的壁垒,但也可能稀释真正困难的突破性工作的稀缺性。

5. 启示与建议

这场对话挑战了一个根深蒂固的假设:人类个体的独立思考能力不仅不会因为工具(如 AI 或 Lean)的增强而贬值,反而是它并非工具的协作网络得以扩大的前提。

针对特定角色,给出以下落地建议:

  • 开发者与产品经理

    • 警惕统计模型的“系统性风险“:不要只看尾部概率的合格率(如 P99 性能)。Mental Model 参考涛提到的 Gödel 不完备性:数学不能证明自己的一致性,同理,金融系统不能通过内部逻辑机制自我监管风险。必须引入外部监督或监管机制。
    • 拥抱“形式验证“作为前端工具:开发高风险代码(如自动驾驶、Web3)时,不要等到形式化验证的工具链(如 Coq/Lean)成熟,而应尽早模拟这种心智模型——假设这是你的 Codebase 中唯一的真理来源。即使是人工编写形式化断言,也能帮助开发者在编写逻辑的同时进行崩坏测试(Fail Fast)。
  • 投资人

    • 反直觉的信号:关注“错误数据“的价值:Tao 提到数学界至今未记录“失败的尝试“和“错误猜想“的过程,这正是 AI 目前缺乏训练数据的原因。投资人应关注那些致力于构建“失败模拟库“或提供“反向模型“的 AI 公司(例如 AlphaZero 的游戏记录分析器)。
    • 关注“压缩率“:Tao 强调用更少的参数解释更多数据。在算法和模型领域,未来的估值倍数将取决于其压缩效率。拥有高压缩率(无需数万亿算力即可解释复杂规律)的方法论将获得溢价。
  • 创业者

    • 寻找“原子化机会“(Atomic Opportunities):借鉴 Tao 的 Equational Theories Project 思路,不要试图从零开始发明一个颠覆性的通用定理,而是寻找一个足够小、足够孤立的逻辑切片(如区块链中的某类具体密码学协议),并利用形式化验证工具和 AI 来全生命周期地解决它。
    • 关注“跨学科模因“(Interdisciplinary Memes):Tao 擅长将电路、流体与数学调度结合。创业者在产品设计时,应拒绝单一维度的思维,主动寻找行业标准解决不了而其他行业(如生物学、流体力学)已有解的“复合型“问题。

结论信号:Tao 对 AI 短期内无法生成复杂意义上“新东西“(如发现统一理论)保持 skepticism,但对其在“现有证明眼中的盲区搬运“表示乐观。过高估量 AI 的探索能力是危险的,低估其在“协调/验证/计算“端的能力则是愚蠢的。

6. 金句摘录

  • “Maxwell’s Demon is a concept in thermodynamics… There could be some sort of weird conspiracy that maybe there’s a microscopic demon… that every time an oxygen and nitrogen atom collide, they’ll bounce off in such a way… So you can have an extremely improbable configuration emerge, which we never see.”

    (Maxwell’s Demon 概念中的“微观恶魔“论:自然界可能存在某种精妙的、违背统计概率的内部 conspiracy,虽然现实中我们从未见过,但数学上无法完全排除其可能性,这正是 Navier-Stokes 奇异性问题的本质。)

  • “Most objects that you can generate in mathematics are random… But there’s a very small number of things that have patterns… But now, you can prove something has a pattern by just constructing… If I give you a specific pattern like the digits of pi, how can I show that this doesn’t have some weird pattern to it?”

    (数学对象中随机是常态,模式是例外。最痛的地方在于:证明某物“确实“没模式很难,但你很难证明某物“不可能“有隐藏模式。“如果是数字 π,我如何证明它没有某种隐藏的自洽逻辑?“这种对负面的排斥困难,构成了数学研究的主要障碍。)

  • “A theory is a compression of the universe… Microsoft Data Compression…, the more compression that you make, the better your theory.”

    (“一个好的物理数学理论是宇宙的数据压缩。你拥有数 PB 级的观测数据,只想用一个描述在五页纸、几个参数的模型来拟合。压缩率越高,理论越好。“这直接适合用于评估任何“黑盒“模型的有效性。)

  • “A lot of mathematicians, just career mathematicians, you just focus on publishing the next paper, maybe promote it one rank, and starting a few projects… But then suddenly people want your opinion on things and you have to think a little bit about things that you might just foolishly say, because you know no one’s going to listen to you, it’s more important now.”

    (获得菲尔兹奖不仅是荣誉,更是“进入商会“(establishment)的门票。这不仅是社交货币,更是一种认知约束——你可能再也无法大胆地谈论任何愚蠢的想法,因为你的话语权升高了,误解你的社会成本也变大了。)

  • “We have only limited access to reality. All we have are the observations, which are incomplete and have errors… But mathematics is concerned with the models. Science collects the observations… What mathematics does, we stay within the model, and we ask what are the consequences of that model?”

    (科学不等于数学。科学关注“现实发生了什么“,而数学关注“假设 X 发生了,根据模型推导,它会导致什么后果“。在投资与商业中,这种区分极为重要:不要用模型的预测去套现实,而是要维护模型的纯粹性,并不断地用新观察去更新模型,而不是去验证现实是否完美符合旧模型。这听起来像是一个经典的“建仓-止盈-复盘“的投资哲学家。)