什么是通用人工智能（General AI/AGI）

AI应用信息3年前 (2023)发布

从古代神话到现代科幻小说，人类几千年来一直梦想着创造人工智能。但是，综合智能的努力直到 1950 年代后期才真正开始，当时十几位科学家聚集在新罕布什尔州达特茅斯学院，参加为期两个月的研讨会，以创造能够“使用语言、形成抽象和概念、解决各种问题的机器”。现在保留给人类，并改善自己。”

研讨会标志着人工智能历史的正式开始。但是，两个月的努力——以及随后的许多其他努力——只证明人类智能非常复杂，当你试图复制它时，复杂性变得更加明显。

这就是为什么尽管经过了 6 年的研究和开发，我们仍然没有能够与人类儿童的认知能力相媲美的人工智能，更不用说可以像成年人一样思考的人工智能了。然而，我们所拥有的是一个科学领域，它被分为两个不同的类别：狭义人工智能(ANI)，我们今天拥有的，以及通用人工智能 (AGI)，我们希望实现的目标。

AGI的要求是什么？

定义通用人工智能非常困难。“一般”已经暗示它是一个非常宽泛的术语，即使我们以人类智能为基准，也并非所有人都具有同样的智能。

但是，一般智能系统应该具有几个特征，例如常识、背景知识、迁移学习、抽象和因果关系。这些是你从小就在所有人类身上看到的那种功能。

了解通用 AI 系统可以做什么的最佳方法是提供一些挑战：

挑战 1：如果您将蝙蝠从场景中移开，接下来会发生什么？

这是一项挑战，需要人工智能了解物理动力学和因果关系。它还应该能够推理反事实，您对场景进行更改的替代场景。

挑战 2：考虑以下文字，在Gary Marcus 和 Ernest Davis 的Rebooting AI 中提到：“Elsie 试图通过电话联系她的阿姨，但她没有接听。”

谁没接电话？

Elsie 和她的阿姨在同一个房间吗？

这一挑战要求人工智能具备电话交谈的基本背景知识。大多数人都知道远程通信和电话的工作原理，因此他们可以推断出句子中缺少的许多内容，例如代词“she”的前因不清楚。

挑战 3：随机进入一间房子，煮一杯咖啡。加入一些牛奶和糖。

这一挑战需要人工智能代理对房屋结构有一个大致的了解。它应具备以下基本知识：食物通常在厨房中找到。厨房通常位于房屋的一楼。咖啡储存在柜子里。牛奶必须放在冰箱里。AI 必须找到咖啡机，如果没有，它必须能够即兴发挥。大多数人下意识地解决了这些问题和其他几十个问题。

挑战 4：尝试按照以下顺序猜测下一张图片，取自François Chollet 的 ARC 数据集。

虽然非常简单明了，但以通用方式解决这些挑战仍然超出了当今的 AI 系统。

以下是人工智能的两种主要方法，以及为什么它们不能单独解决人工智能问题。

符号 AI 与通用 AI

创建人工智能的早期努力集中在创建基于规则的系统，也称为符号人工智能。符号 AI 的前提是人类大脑操纵符号这一事实。我们有物体、人物、概念、状态、动作等的心理表征，我们使用这些表征（符号）来处理我们通过感官接收到的信息，对我们周围的世界进行推理，形成意图，做出决定，等等。

符号人工智能系统取得了早期进展。计算机编程语言是在符号操作的基础上创建的。您可以在每种编程语言中找到的类、结构、变量、函数和其他关键组件的创建使人类能够将符号转换为计算机指令。

但是符号人工智能有一些根本性的缺陷。只要您可以将任务的逻辑编码为规则，它就可以工作。但是，为智能的各个方面手动创建规则几乎是不可能的。

在 1980 年代，人工智能科学家尝试使用专家系统、基于规则的程序尝试这种方法，这些程序试图对特定学科（如医学）的所有知识进行编码。专家系统在非常狭窄的领域取得了成功，但一旦他们试图扩大其影响范围并解决更普遍的问题，就失败了。它们还需要计算机程序员和主题专家的巨大努力。

符号人工智能的另一个问题是它没有解决世界的混乱。一个例子是检测图像中的对象。计算机将视觉数据视为像素块，即表示图像上点颜色的数值。

图像中的每个对象都由一个像素块表示。使用符号 AI 解决这个问题的天真方法是创建一个基于规则的系统，将图像中的像素值与特定对象的已知像素序列进行比较。这种方法的问题在于，一个对象的像素值会根据它在图像中出现的角度、光照条件以及它是否被另一个对象部分遮挡而有所不同。

例如，考虑以下一组图片，其中都包含篮球。从图像中可以清楚地看出，每张照片中篮球的像素值都不同。在其中一些球体中，球的一部分被阴影遮蔽或反射强光。在一些图片中，球被球员的手或球网部分遮挡。然而在另一些情况下，线条和文字以不同的角度出现。球的大小根据它离相机的远近而变化。

要使用纯符号 AI 方法解决此问题，您必须添加更多规则：收集不同条件下不同篮球图像的列表，并添加更多if-then规则，将每个新图像的像素与您收集的图像列表进行比较. 但是，篮球在照片中的出现方式几乎是无限的，无论您将多少图像添加到数据库中，一个逐像素比较的严格的基于规则的系统都无法提供不错的物体识别准确度。

请注意，这是一个篮球，一个简单的球形物体，无论角度如何都保持其形状。现在想象一个更复杂的物体，比如一把椅子，或者一个可变形的物体，比如一件衬衫。任务的复杂性将呈指数级增长。

人工智能的历史和对人类智能的研究表明，符号操作只是通用人工智能的几个组成部分之一。

通用人工智能与机器学习

几乎与符号 AI 的研究并行，另一条研究重点是机器学习算法，即通过经验发展其行为的 AI 系统。

虽然机器学习算法有许多不同的风格，但它们都有一个相似的核心逻辑：您创建一个基本模型，通过提供训练示例来调整其参数，然后使用经过训练的模型来预测、分类或生成新数据。

机器学习最受欢迎的分支是深度学习，这个领域在过去几年受到了很多关注（和金钱）。深度学习算法的核心是深度神经网络，即层层叠叠的小型计算单元，当这些计算单元组合在一起并相互堆叠时，可以解决以前计算机无法解决的问题。

一个深度神经网络由几层人工神经元组成

神经网络特别擅长处理杂乱的、非表格数据，例如照片和音频文件。近年来，深度学习已成为计算机视觉、语音识别和自然语言处理进步的关键。

回到上一节中提到的对象检测问题，下面是深度学习如何解决这个问题：首先，您创建一个convnet，一种特别擅长处理视觉数据的神经网络。然后，您在许多标有相应对象的照片上训练 AI 模型。最后，您通过提供新图像并验证它是否正确检测和标记其中包含的对象来测试模型。

深度神经网络不是逐像素比较，而是开发它们在训练数据中找到的模式的数学表示。与符号 AI 相比，神经网络更能适应图像中对象外观的细微变化。

但是深度学习能解决一般的 AI 问题吗？当然不是。迄今为止，神经网络已被证明擅长数据的空间和时间一致性。但是他们在概括自己的能力和像人类一样对世界进行推理方面非常差。

训练有素的神经网络可能能够检测到本文开头视频中的棒球、球棒和球员。但是很难理解场景中不同对象的行为和关系。神经网络在处理与训练示例在统计上不同的新情况时也会开始崩溃，例如从新角度观察对象。