技能悖论:为何人工智能精通国际象棋,却在楼梯上绊倒

Gábor Bíró 2024年5月14日
5 阅读时间

想象一下,一台机器能够击败世界上最伟大的国际象棋大师,创作交响乐,或证明复杂的数学定理。现在,想象一下同一台机器,却难以简单地穿过房间而不撞到家具,或无法可靠地倒一杯咖啡。这种刺眼的对比正是莫拉维克悖论的核心所在。莫拉维克悖论是人工智能和机器人学中的一项基本观察,最早由汉斯·莫拉维克和其他人在1980年代提出。它揭示了人类和机器之间难度令人惊讶的倒置:我们认为困难的事情,它们通常觉得容易;而对我们来说自然而然的事情,对它们来说可能具有巨大的挑战性。为什么会这样?这又告诉我们关于智能本质的什么呢?

技能悖论:为何人工智能精通国际象棋,却在楼梯上绊倒
来源: 作者原创

核心难题:易与难,颠倒了

莫拉维克悖论的核心在于突出的二分法。对于人类来说,需要付出大量有意识的努力和多年训练才能掌握的高级推理——例如战略规划(国际象棋)、符号操作(数学)或抽象逻辑——通常可以通过相对适度的计算资源在计算机上复制。算法可以遵循规则,探索广阔的可能性空间,并在定义明确的领域内以惊人的效率优化结果。

相反,即使是蹒跚学步的幼儿也能毫不费力地执行的低级感知运动技能——在人群中识别面孔、在不平坦的地形上导航、拿起不熟悉的物体、保持平衡——在机器中复制起来却极其困难且计算成本高昂。这些任务是我们凭直觉完成的,很大程度上是无意识的,依靠的是数百万年进化过程中磨练出来的技能基础。

解开“为什么”:进化和现实的噩梦

最常见的解释源于进化时间线。我们的感知运动技能代表了动物智能的古老基石。感知、移动和与物理世界的互动已经持续不断地完善了数亿年。这些能力深深地融入了我们的神经结构,为了应对现实世界的复杂性而被优化到了令人难以置信的程度。

抽象推理、语言和数学虽然是人类智慧的标志,但却是进化史上晚得多的发展——仅仅数万或数十万年的历史。它们没有经历过同样漫长的优化过程,也没有那么根深蒂固,这使得它们的底层逻辑可能更容易(虽然并非易如反掌)被逆向工程并以算法实现。

但其中不仅仅是进化年龄的问题。复制感知运动技能在计算上是噩梦般的,因为物理世界本质上是混乱的、不可预测的,并且需要处理海量的实时、嘈杂的感官数据。以步行为例:它涉及持续的视觉扫描、处理来自脚部的触觉反馈、通过整合来自内耳的信号来维持动态平衡、预测表面摩擦以及进行微调——所有这些都是同时且自适应地进行的。这需要:

  • 大规模并行处理:同时处理各种感官输入。
  • 驾驭模糊性和不确定性:处理不完整的信息、传感器噪声和不可预测的事件。
  • 内隐的物理直觉:对物理学的广泛、未言明的理解(“常识”)——物体如何运动、重力的影响、材料的属性。
  • 具身认知:我们的智能不仅仅存在于我们的大脑中;它还与我们的身体及其与环境的互动深深地交织在一起。传统人工智能通常缺乏这种基础。

现代人工智能机器中的莫拉维克幽灵

即使在今天人工智能取得突破的背景下,这个悖论仍然具有惊人的现实意义:

  • 深度学习的双刃剑:虽然深度学习彻底改变了图像和语音识别等感知任务(克服了一些早期的感知障碍),但构建具有类人灵巧性、适应性和强大物理交互技能的机器人仍然是一项前沿挑战。机器人仍然难以操纵不熟悉的物体或适应意外的物理情况。
  • 强化学习的攀升:诸如强化学习之类的技术使人工智能能够通过试错来学习复杂的行为,这在机器人技术中显示出希望。然而,它们通常需要大量的训练数据(真实的或模拟的),并且可能难以将学习有效地从模拟转移到不可预测的现实世界(“从模拟到现实的差距”)。
  • 大型语言模型(LLM)的雄辩:像ChatGPT这样的模型展示了在语言、逻辑和代码生成方面的惊人能力——高级推理的经典例子。然而,它们对物理世界的真正理解却为零,这种理解源于感官经验。它们可以完美地描述走下楼梯,但对平衡、重力或台阶的感觉没有任何具身理解——这是悖论在现代的鲜明体现。

更广泛的影响:自动化、通用人工智能和重新思考智能

莫拉维克悖论在实验室之外具有重大意义:

  • 工作的未来:它表明,与需要体力灵巧、情境感知以及与不可预测的物理世界互动的职业(例如,管道、养老护理、建筑、手工艺)相比,需要高级抽象推理的职业(例如,数据分析、编程、金融建模)可能在近期内更容易受到自动化的影响,这与直觉相反。
  • 对通用人工智能(AGI)的追求:该悖论强烈暗示,实现类人通用人工智能不仅仅是扩大抽象思维的计算能力。它可能需要破解感知运动智能的密码,并将其与推理无缝集成——创建通过物理经验学习的具身人工智能。
  • 什么是“难”?它迫使我们质疑我们对智能的假设。抽象思维真的是顶峰吗?还是对物理世界的毫不费力的掌握是一种更深刻、更基本的智能形式,而我们常常认为这是理所当然的?

结论:持久的洞见

莫拉维克悖论不仅仅是一个历史脚注;它是对生物智能和人工智能不同架构的持久洞见。它突出了我们看似简单的身体能力中隐藏的巨大复杂性,并强调了创建真正通用的智能机器所面临的挑战。虽然人工智能在特定的、通常是抽象的领域中不断取得超人的成就,但人类(和动物)身体能力的日常奇迹不断提醒我们,还有广阔的领域尚未被征服。理解这个悖论不仅对于欣赏我们自身的能力至关重要,而且对于指导人工智能研究的未来轨迹,使其朝着能够真正感知、行动并在丰富多彩的现实世界中学习的系统发展至关重要。

Gábor Bíró 2024年5月14日