完成条件
2. 表征与推理(中学指南)
核心观点
- 表征是数据结构;推理方法是算法(人工智能运用计算机科学的工具:数据结构与算法)
- 表征支持推理;推理方法作用于表征(表征和推理是相互依存的)
- 知识表征的两种主要类型是符号表征和数值表征(使用符号表征进行推理是通过逻辑推理规则来实现的,而使用数值表征进行推理则会利用诸如神经网络之类的复杂数学函数)
- “知晓” 某事物意味着具备对其进行表示以及运用其进行推理的能力(书籍和视频能够呈现知识,但它们并不 “知晓” 事物,因为它们无法利用这些知识)
- 如果智能体采用一种并非简单的 “感知 - 思考 - 行动” 循环机制来朝着实现自身目标取得进展,那么它们就会被视作是智能的(要被认定为智能的,在 “感知”“思考(推理)” 或 “行动” 这些组成部分中,至少有一个部分必须需要复杂的计算方法或强大的计算能力。车库门开启装置并非智能体,因为它们的感知、推理和行动过程都非常简单)
表征:抽象(2-A-1)
- 学习目标:展示如何用通俗语言描述来呈现一个游戏棋盘(例如,井字棋、蛇梯棋、大富翁、国际象棋)。
- 基本理解:一个游戏棋盘的关键信息在于组成棋盘的方格集合、这些方格之间的相互关系以及棋子的位置。
- 详细说明:游戏程序是基于棋盘的抽象表示来运行的。一个国际象棋程序知晓全部 64 个方格的横行和纵列,但它不会呈现出实体棋盘的属性,比如棋盘的尺寸或者制作棋盘的材料。
表征:符号表征(2-A-2)
- 学习目标:展示将诸如游戏棋盘、路线图或思维导图等结构转化为带标签的图,并解释其组成部分的作用。
- 基本理解:图的节点表示事物,边(链接)表示这些事物之间的关系。标签提供了关于节点和边所代表内容的额外信息。
- 示例:在游戏《蛇梯棋》(最初叫《蛇与梯子》)中,棋盘上的方格在图中表示为节点。表示相邻方格的节点由 “后继” 边连接。其对应的方格可通过滑梯或梯子到达的节点则由 “滑梯” 或 “梯子” 边连接。在路线图中,城市是节点,道路是边。这些边可能会标有道路名称或里程数值。思维导图是一种人们使用的非正式知识图谱,而非供计算机使用。
表征:数据结构(2-A-3)
- 学习目标:描述图的组成部分以及各部分之间的关系。
- 基本理解:图是由带标签的边连接起来的带标签节点的集合。每条边都有一个源节点和一个目标节点;每个节点都有一组入边和一组出边。树是图的一种特殊情况。
- 详细说明:人工智能中的图可用于表示多种事物,例如路线图(其中城市作为节点,道路作为边)、迷宫以及知识图谱等。知识图谱能够表征人、地点和事物,以及它们之间的关系。思维导图大多属于树结构,但也可能存在多条通往同一节点的路径,此时该思维导图就构成了图。每个节点代表一个概念,边可以用概念之间的关系进行标注,也可以不标注。
表征:特征向量(2-A-4)
- 学习目标:解释词嵌入(即特征向量)是如何将单词表示为数字序列的。
- 基本理解:词嵌入是神经自然语言处理的关键组成部分,应用于包括机器翻译(例如谷歌翻译)和文本生成系统(如双向编码器表征变换器(BERT)、生成式预训练 Transformer 3(GPT3)等)。
- 详细说明:每个单词都是高维特征空间中的一个点,其组织方式使得在特征空间中,语义相近的单词彼此靠近。可查看这个 Word2Vec(词向量)演示示例。
搜索:状态空间与算子(2-B-1)
- 学习目标:展示计算机如何通过绘制搜索树来解决迷宫问题、在地图上找到路线,或者在知识图谱中对概念进行推理。
- 基本理解:计算机使用图搜索算法来解决迷宫问题、寻找驾车路线,以及在知识图谱中对概念进行推理,这些算法会构建搜索树。
- 详细说明:图搜索问题的搜索空间是指从图中指定的起始节点出发的所有路径的集合。用于解决迷宫问题的操作是将节点向北、向南、向东或向西移动一格。在更一般的图搜索情况中,这些操作是通过在路径末端添加一个新节点来扩展路径。合法的移动是添加一个在图中可通过直接边到达的节点。合法状态是指那些通过一系列合法移动能够到达的状态。
- 示例:为了确定袋鼠是否属于哺乳动物,我们在知识图谱中搜索从 “袋鼠” 节点到 “哺乳动物” 节点的路径,这条路径由 “属于” 边组成。快速入门文章。
搜索:组合搜索(2-B-2)
- 学习目标:对使用广度优先搜索解决图搜索问题的过程进行建模,以绘制出搜索树。
- 基本理解:广度优先搜索可用于解决涉及对图进行推理的问题。
- 详细说明:在广度优先搜索中,搜索树当前层级的所有节点会被逐一展开,以生成下一层级的节点。然后,对新生成的下一层级节点进行展开,如此循环这个过程,直至达到目标。给定一个表示朋友关系的图,判断两个人是否有共同的朋友就是一个图搜索问题。另一个图搜索问题是确定两个人之间的间隔度数,就如同 “凯文・贝肯的六度分隔理论” 那样。
推理:推理问题的类型(2-C-1)
- 学习目标:将问题归类为分类问题、预测问题、组合搜索问题或序列决策问题。
- 基本理解:预测问题与分类问题类似,不同之处在于预测问题估计的是一个连续值,比如身高或每日温度。序列决策问题会针对任何给定状态选择下一步行动,以便使总体奖励最大化。
- 详细说明:序列决策问题在要点三(Big Idea 3)中有所涉及;可使用强化学习来解决这些问题。
- 示范:垃圾邮件与非垃圾邮件(分类问题)、明天的最高气温(预测问题)、解决像 “狼、羊和卷心菜” 这样的谜题(组合搜索问题),以及玩像《超级马里奥》这样的电子游戏(序列决策问题)。
推理:推理算法(2-C-2)
- 学习目标:比较几种可用于解决特定类型推理问题的算法。
- 基本理解:推理算法的选择取决于输入数据的特征以及需要做出的决策类型。
- 详细说明:对于区分狗和猫的分类问题,如果我们只有原始图像,就不能使用决策树,因为这将需要数量庞大到难以想象的节点;我们必须使用神经网络,因为它能够高效地执行特征提取。但如果我们已经拥有根据诸如口鼻长度和耳朵形状等特征对动物的描述,那么就可以使用决策树。
- 一般来说,分类问题可以使用决策树、最近邻算法或神经网络来解决。预测问题可以使用线性回归或神经网络来解决。组合搜索可以利用几种不同的算法来生成搜索树。序列决策问题可以使用 Q 表或神经网络来选择最佳行动。