Terence Tao: Nobody Understands Why AI Actually Works (2025-12-31, glm-4.7-flash)

Terence Tao 访谈深度研报：AI 是完美的鹦鹉，还是数学本能的量化？

1. 导读

当前 AI 领域充斥着一种“技术乐观主义”的迷雾——大多数从业者大多在谈论应用落地、算力堆叠或模型收敛曲线。然而，来自加州大学洛杉矶分校（UCLA）的传奇数学家兼菲尔兹奖得主陶哲轩在最新访谈中抛出了一个不仅反直觉、甚至带有某种寒意的论断：我们正处于人类认知能力与机器繁殖能力的巨大断裂带上。作为全球顶尖头脑的集合体，陶哲轩不仅在过去十年解决了 pure mathematics（纯数）与 applied science（应用科学）之间长期存在的鸿沟，更是因为敏锐洞察到 AI 幻觉背后的数学黑洞（如 Benford 定律的违背）而备受瞩目。此时此刻，当整个行业都在试图将大模型囤积的内容转化为生产力时，如果抽离掉所有的工程细节，这场对话实际上是在探寻一个根本性的哲学问题：当 AI 模拟的“随机性”还不如人类粗制滥造的随机性强时，我们实际上是在理解世界，还是仅仅在玩弄概率的表象？这期节目揭示了未来认知基础设施的核心矛盾——如果人类教会机器的不是逻辑而是概率，那么我们将被迫完成从“知识验证者”到“谎言审计员”的物种进化。

2. 核心观点

陶哲轩的核心世界观是一种极具冷静色彩的“断裂论”：现代大语言模型虽然能生产出流畅、看似完美的数学推导，但从数学本质上讲，它是在极其有限的维度上对人类历史数据的“高维压缩”与“软恢复”，而非基于运算逻辑的真理发现。这种观点极具争议，因为它挑战了“AI 将通过深度学习模仿大脑神经元而涌现智能”的主流叙事，转而认为 AI 本质上是一个记录了人类数学语言的“超级索引器”。

AI 无法通过“前向预测测试”，这是它作为推理工具的边界。 在陶哲轩 proposed 的“Keating Test”（基于图灵测试的变体）中，他要求 AI 利用既有的天文观测数据做出符合物理规律的新增预测，而非重复已知的历史结果。令人惊讶的是，即使是与 JPL（喷气推进实验室）微距连接的最先进模型，也无法执行这一任务——它需要对连续的物理变量进行欧几里得化离散处理，这会破坏其底层逻辑。
- 底层逻辑： 目前的模型架构（矩阵乘法与高维向量化）本质上是在做相关性匹配，而非因果或预测推导。
- 背书数据： 访谈中提到陶哲轩曾利用模型处理水星轨道数据的失败案例，证明模型无法理解连续流背后的结构张力。
数学之美在于“压缩”，而 AI 缺乏这种信息论上的进化动力。 数学语言的自然演化是为了极致的效率，目标是像“极简主义”那样将宇宙的信息以最少符号描述出来。而自然语言充满了冗余、情感与灰色地带，后者在信息传输中是低效的。陶哲轩认为，正是这种对“极简性”的追求，让数学语言在描述弯曲时空、量子异常等现象时，能与物理世界的底层模型天然契合。
- 底层逻辑： Wigner 的“数学在物理中的不合理有效性”并非偶然，而是因为数学语言本身就是对宇宙规律的“格式化缓存”。AI 目前尚未表现出这种为了“压缩生存”而进化的逻辑。
- 背书数据： 陶哲轩引用爱因斯坦几何语言统一时空的例子，指出当数学模型与物理世界简化到一定程度时，拟合度会骤增。
数学家的真正价值正在从“发现真理”转向“验证真理”。 随着本科级别的数学作业已被 AI 彻底席卷，陶哲轩断言，高等教育的核心任务必须重构。他提出一个极具实操性的假设：未来的第一性原理不是教会学生“怎么做”，而是教会学生“怎么查”和“怎么审”。
- 底层逻辑： 在知识泛化已成常态的时代，判断力的边际收益远高于记忆力的边际收益。人类必须学会区分“文本的规范性”与“逻辑的严密性”。
- 背书数据： 陶哲轩展示了“把题目喂给 AI，然后用错题集来反向训练学生”的新型教学模式，这一模式已在部分先锋教育工坊中验证有效。
最底层的数学悖论依然存在：数论并不“伪随机”。 虽然加密货币和 K-12 课堂认为质数像随机噪声一样不可预测，但陶哲轩指出质数显然是“伪随机”的——它们避开了偶数等明显模式，却又缺乏随机噪声的高度混乱性。这种介于确定性和随机性之间的模糊地带，是 AI 作为工具的终极陷阱。
- 底层逻辑： 真正的随机（如量子基态噪声）与小波函数预言的伪随机（计算出的密钥流）在数学分布上存在微妙的统计学差异。AI 目前难以捕捉这种非高斯分布的特征。
- 背书数据： 访谈提及陶哲轩参与关于“Knot Theory”（结理论）的神经网络研究，通过高维不变量预测签名，证明只有引入人类约束条件，黑盒网络才能转化为数学公理。

内在逻辑链条： 这一系列观点形成了一个闭环——AI 的局限性源于其架构缺乏“前向预测”与“极简压缩”能力；为了弥补这一缺陷，人类必须利用AI扫描那些难以触达但需求庞大的“长尾难题”；而在这个过程中，人类必须承担起最后的“审计员”职责，这正是 AI 作为工具而非主宰存在的合理定位。

3. 批判与质疑

从外部视角审视陶哲轩的论述，我们发现虽然他对大模型概率本质的剖析切中肯綮，但其论断在工程落地和哲学层面临着严峻的挑战。

首先，陶哲轩对 AI 的“认知边界”假设依然基于传统神经网络的架构，忽略了模型架构进化的可能性。 他列举了模型无法通过 Keating Test 的例子，这些失败通常源于基础算术或连续物理的处理。然而，人类的大脑处理数值时也需要离散化，我们无法反证这种“离散化路径”就是唯一的路径。如果未来出现基于基因算法或思维链交互的自适应架构，能否打破这种“记忆-复读”的死循环尚属未知。

其次，他过分放大了“人类验证”的重要性，而低估了辅助验证的成本。 在陶哲轩提出的“长尾策略”中，利用 AI 解决 10% 的百万级中等难题听起来很美，但构建一个能自动验证百万份各异产出（即便只有 10% 是对的）的自动化验证管线，其工程复杂度可能远超项目本身的价值。这不仅是人力问题，更是系统架构的灾难。

最后，在“数学即语言”这一命题上显得过于唯心。 尽管数学确实压缩了信息，但将毕达哥拉斯定理或爱因斯坦场方程归结为“语言优化”似乎抹杀了背后的物理实体。相反，可能是物理世界的某些结构恰好嵌入了离散的算法逻辑，这种“映射”可能是双向的、涌现的，而不仅仅是数学家在事后用一种高效的语法“命名”了它。

4. 行业视野

这场对话将 AI 的困境置于了从计算物理时代向“数据驱动科学”过渡的十字路口。

从行业历史来看，这与 17 世纪纳皮尔发明对数或伽利略发明几何罗盘有着惊人的相似性。当时，工具的发明使得原本需要全手工计算的科研工作变得可行，但同时也将“计算”本身从思维中剥离出来。陶哲轩提到的“压缩感知”理论，实际上正是这种历史回响——它证明了我们可以通过被扰动的数据（如在 MRI 中减少测量次数）恢复高维图像，这本身就是对“数据迷信”的解构：数据量的增加不一定带来精度的绝对提升，关键在于理解数据的内在结构。

在当前的大语言模型浪潮中，这期播客代表了**“符号主义”学派对“连接主义”学派的一次微妙反击**。符号主义者（包括陶哲轩）认为逻辑和证明是思维的基石，前者是基于规则的，后者是基于概率的。陶哲轩主张 AI 只是与人类互补，这实际上是在捍卫数学研究作为人类最后堡垒的阵地。这也呼应了历史上“蒙特卡洛方法”与严格证明之间的张力——尽管模拟可以给出答案，但严谨性依然不可或缺。

5. 启示与建议

这场对话挑战并重置了我们对“专业知识”的假设。传统的专家价值不再源于“已知真理的垄断”，而在于“在 AI 碎片化信息中缝合意义的能力”。

推荐读者：

计算型产品负责人与数据架构师
理论物理方向的算法研发专家
顶尖学府的资深教授与教研设计者

具体建议：

对于数据架构师布署方向： 不要单纯追求数据的“量”，而要思考数据的“结构”。陶哲轩在 MRI 图像分析中的应用表明，真正的降噪往往不是通过更多样本堆叠（BDNF），而是利用稀疏性减少采样次数。在产品设计中，引入“压缩感知”思维——即有时候容忍低分辨率以换取计算效率，远优于追求高清却导致过拟合。
对于教研设计者： 彻底淘汰“证明推导”类的标准化测试。正如陶哲轩所言，现在已经进入了一个“AI 背书所有权威”的时代。未来的考核应该包含“红队测试”（Red Teaming），即给定一个 AI 生成的完美输出，要求学生指出其中的逻辑谬误。这将迫使学生从“记忆者”转变为“批判者”。
对于算法研发： 在处理连续变量（如时间、温度、经济指标）时，必须谨慎采用离散化的 Transformer 架构。如果涉及物理预测（如气象或引力波），任何切断连续性的步骤都必须经过人工校准，否则会引入不可解释的系统误差。

强信号与推断： “Keating Test”是一个极其强的前瞻性指标，凡是涉及物理预测、医疗诊断等领域的应用，必须以此作为 MVP 验证的第一关。AI 在纯数学符号处理上看似强大，但一到涉及“从观察到自然的跳跃”时，表现依然处于石器时代。

6. 金句摘录

“Proof by contradiction… It’s actually a very intuitive proof technique, but you have to teach it the right way and sometimes kids can teach themselves.” （无意中揭示了直觉的逻辑学本质：有时“否定预设”和“自悖”并不像阶梯那样难以攀登，关键在于引导者的智慧与切入点。）
“Primes … are not random. We believe they’re what’s called pseudo-random.” （质疑了当下所有基于“随机性假设”的加密与安全架构。如果质数只是带有伪随机伪装的算法序列，世界的基础信任将瞬息崩塌。）
“Mathematics can tell you what’s possible… It provided the theoretical limit.” （数学家的终极职能不再是发现，而是划定边界。在这个算力过剩的时代，知道“做不到什么”比知道“能做什么”更具资本价值。）
“We need to keep separate the real world and our models of the real world… you can have both your mathematical cake and eat it too.” （关于模型泡沫主义的解毒剂。牛顿力学不正确但仍有用——即便模型是错的，只要它有用，我们就可以暂时忽视它的错误性。这可能是避免 AI 社会学泡沫的哲学基石。）
“If you use them as a component of a more rigorous and grounded reasoning system… Only output in some verified some language that you can verify.” （如何驯服巨兽的实操手册：将概率黑盒限制在形式化逻辑的牢笼之内，用确定性语言的“插件”来约束模型的幻觉。）

Keyboard shortcuts