人工智能的五大理念——9-12年级
站点: | 科创教育数字化教学平台 |
课程: | 人工智能教学指南与实操(中学) |
图书: | 人工智能的五大理念——9-12年级 |
打印: | 访客用户 |
日期: | 2025年05月3日 星期六 11:04 |
1. 感知(中学指南)
侦测:生物(1-A-1)
不适用 —— 就人工智能而言,这个主题在较低年级段已经得到了充分的阐述。其他课程,比如生物学或感官心理学选修课,可以更深入地探讨诸如味觉、嗅觉、本体感觉和前庭器官等话题。
侦测:计算机传感器(1-A-2)
- 学习目标: 描述各类计算机传感器的局限性和优势。
- 基本理解:传感器是用于测量诸如光、声音、温度或压力等物理现象的设备。
- 详细说明:摄像头的分辨率、动态范围和光谱灵敏度都存在一定的局限性。麦克风的灵敏度和频率响应范围也有限。信号可能会受到噪声的干扰而减弱,比如处于嘈杂环境中的麦克风。一些传感器能够检测到人类无法察觉的事物,例如红外或紫外图像,或是超声波。
侦测:数字编码(1-A-3)
- 学习目标:解释雷达、激光雷达、全球定位系统(GPS)以及加速度计的数据是如何表示的。
- 基本理解:雷达和激光雷达进行深度成像:每个像素都是一个深度值。全球定位系统(GPS)利用卫星信号进行三角测量来确定位置,并以经度和纬度的形式给出具体地点信息。加速度计则在三个相互正交的维度上测量加速度。
- 详细说明:雷达和激光雷达通过测量反射信号返回至收发器所需的时间来测定距离。全球定位系统(GPS)通过对来自三颗或更多卫星的精确定时信号进行三角测量来确定位置。加速度计使用相互正交排列的应变片来测量三个维度上的加速度。
加工:侦测与感知(1-B-1)
- 学习目标:解释感知算法以及它们在现实世界应用中是如何被使用的。
- 基本理解:许多设备和服务都依赖于专门的感知算法,例如,车牌识别器、邮政编码识别器、基于面部识别的手机解锁功能、在脸书帖子中标记人物、物体识别(如谷歌镜头),或者基于语音的客服服务。
加工:特征提取(1-B-2)
- 学习目标:解释如何从波形和图像中提取特征。
- 基本理解:语音频谱图展示了一个波形在不同频段中存在的能量情况。共振峰是一种听觉特征,被定义为频谱图中能量集中的区域。从图像中提取特征的过程,起始于检测图像中的边缘,或者是多个尺度下的强度梯度。
- 详细说明:不同的共振峰模式与不同的语音发音相关联,也就是说,与不同的元音和辅音相关。
加工:抽象流水线-语言(1-B-3)
- 学习目标:举例说明从波形到句子的语音理解的抽象层次结构,展示每个层次的知识是如何用于解决较低层次中的歧义问题的。
- 基本理解:口语语言的层次结构为:波形→发音动作→声音→词素→单词→短语→句子。
- 详细说明:要从嘈杂、有歧义的信号得出其含义,需要识别结构,并在多个抽象层次上应用领域知识。一个经典的例子:“How to recognize speech(如何识别语音)” 和 “How to wreck a nice beach(如何破坏一个不错的海滩)” 这两个句子在波形层面上几乎是完全一样的。
加工:抽象流水线-视觉(1-B-4)
- 学习目标:演示在更高抽象层次上的感知推理是如何利用早期较低抽象层次的信息的。
- 基本理解:场景由物体构成,而物体由表面和边界组成。边界由轮廓来标识,轮廓由边缘构成,而边缘又是由像素组成的。场景中物体之间的关系,比如一个物体遮挡了另一个物体,是通过它们表面和边界的排列情况推断出来的。
领域知识:领域知识的类型(1-C-1)
- 学习目标:分析一个或多个在线图像数据集,并描述这些数据集所提供的信息,以及如何利用这些信息为计算机视觉系统提取领域知识。
- 基本理解:人工智能系统中的领域知识通常源自从数百万个句子或图像中收集到的统计数据。
- 详细说明:图像数据库示例:
- ImageNet:https://image-net.org/
- Coco:http://cocodataset.org/#explore
在输入文本或电子邮件时的单词预测功能,就是一个类似于在高级感知系统中使用统计预测的例子。分析大量的图像集合可以得出关于哪些类型的物体可能会在一个场景中同时出现的统计数据。
领域知识:包容性(1-C-2)
- 学习目标:描述在使计算机感知系统能够良好地服务于不同群体时所面临的一些技术难题。
- 基本理解:相较于明亮且高对比度的面部特征,暗沉或低对比度的面部特征更难以识别。儿童的语音音调比成年人更高,而且发音也不如成年人清晰。
2. 表征与推理(中学指南)
核心观点
- 表征是数据结构;推理方法是算法(人工智能运用计算机科学的工具:数据结构与算法)
- 表征支持推理;推理方法作用于表征(表征和推理是相互依存的)
- 知识表征的两种主要类型是符号表征和数值表征(使用符号表征进行推理是通过逻辑推理规则来实现的,而使用数值表征进行推理则会利用诸如神经网络之类的复杂数学函数)
- “知晓” 某事物意味着具备对其进行表示以及运用其进行推理的能力(书籍和视频能够呈现知识,但它们并不 “知晓” 事物,因为它们无法利用这些知识)
- 如果智能体采用一种并非简单的 “感知 - 思考 - 行动” 循环机制来朝着实现自身目标取得进展,那么它们就会被视作是智能的(要被认定为智能的,在 “感知”“思考(推理)” 或 “行动” 这些组成部分中,至少有一个部分必须需要复杂的计算方法或强大的计算能力。车库门开启装置并非智能体,因为它们的感知、推理和行动过程都非常简单)
表征:抽象(2-A-1)
- 学习目标:描述如何将一个概念表示为一种模式(架构)。
- 基本理解:一种模式(架构)通过列出其上位概念并定义其属性来描述一个概念,其中一些属性可能是从上位概念继承而来的。示例可在 schema.org 网站上找到。
- 详细说明:数以百万计的网站使用模式(架构)表示法,以使利用知识图谱的人工智能程序能够理解信息,例如搜索引擎和推荐系统。示例包括针对诸如餐馆之类的商业机构的模式(架构),以及描述诸如书籍、电影和电视剧之类的创意作品的模式(架构)。
表征:符号表征(2-A-2)
- 学习目标:将用英语表达的三段论的前提翻译成逻辑符号表示,并正确完成该三段论。
- 基本理解:三段论以一种特定方式来表示关于类别和实例的陈述,这种方式使得计算机能够依据简单的推理规则,从现有知识中推导出新知识。三段论的组成部分包括大前提、小前提和结论。
- 详细说明:人类的推理丰富且复杂,我们尚未完全掌握其运作机制。三段论推理是一种特殊情况,它足够简单,以至于我们能够为其制定精确的规则。三段论推理是一种逻辑演绎形式,在使用分类信息的人工智能推理器中较为常见。例如:所有人都是哺乳动物,所有哺乳动物都是生物,所以所有人都是生物。三段论可以使用多种符号表示法。以下是一种基于谓词逻辑的表示法:
∀x [ Human(x) → Mammal(x) ]
∀x [ Mammal(x) → LivingThing(x) ]
________________________________________
∀x [ Human(x) → LivingThing(x) ]
表征:数据结构(2-A-3)
- 学习目标:描述在知识图谱中模式(架构)是如何被用来构建关于人物、地点或事物的信息的。
- 基本理解:一种模式(架构)会指定所描述概念的属性,以及该概念与其他概念之间的关系。例如,“餐馆” 模式(架构)会从 “餐饮场所” 模式(架构)继承属性。
- 详细说明:知识图谱对有关事物及其相互关系的信息进行编码。像谷歌这样的搜索引擎依靠知识图谱在搜索结果中生成知识面板。“餐馆” 模式(架构)和 “餐饮场所” 模式(架构)是在schema.org网站上定义的。
表征:特征向量(2-A-4)
- 学习目标:描述 Transformer 网络的运行方式。
- 基本理解:Transformer 网络将输入单词序列映射为输出单词序列,其中单词以特征向量的形式表示。
- 详细说明:诸如机器翻译或问答系统之类的神经网络自然语言处理应用程序,是由作为特征向量的词嵌入表示来驱动的。单词每次以一个向量的形式输入,并且网络每次输出一个向量。
- 活动:https://app.inferkit.com/demo
搜索:状态空间与算子(2-B-1)
- 学习目标:识别现实世界中属于搜索问题的问题类型,并描述这些问题的状态和操作符。
- 基本理解:如果一个问题能够描述为从起始状态找到一条通向目标状态的路径,那么计算机就可以使用搜索技术来解决许多类型的此类问题。
- 详细说明:示例包括任务规划问题、调度问题和资源分配问题。搜索算法会确定应用哪些操作符以及应用的顺序。即使对于那些其解决方案并非是一个序列的问题,也可以通过寻找一系列合法的操作(操作符)来达到目标状态。例如,如果问题是将各种大小的一组对象打包到一组具有不同容量的容器中,那么解决方案就是将对象分配到容器中,使得没有容器被装得过满,并且没有对象被遗漏。这可以被表述为一个搜索问题,其中操作符是将一个对象放置到能够容纳它的容器中,而目标状态则是所有对象都已放置好。对于这类问题,应用操作符的顺序并不重要。
搜索:组合搜索(2-B-2)
- 学习目标:举例说明广度优先搜索、深度优先搜索和最佳优先搜索算法,以针对图搜索问题生成搜索树。
- 基本理解:有多种用于生成搜索树的算法,每种算法都有其自身的优势。
- 详细说明:可以通过绘制搜索树来进行说明;对于程度较高的学生(如参加美国大学预修课程计算机科学 A(AP CSA——Advanced Placement Computer Science A)的学生)来说,编写代码是合适的做法。如果存在较浅层次的解决方案,广度优先搜索能够快速找到这些方案,但它需要大量的内存。在每一层节点数量呈指数增长的情况下,深度优先搜索比广度优先搜索更具优势,因为它占用的内存更少。在能够对解决方案的 “代价” 进行准确度量(例如,在路线图上的总距离)的情况下,最佳优先搜索能够找到最优(代价最小)的解决方案,而广度优先搜索和深度优先搜索所找到的解决方案并不能保证是最优的,因为它们没有考虑到代价因素。
推理:推理问题的类型(2-C-1)
- 学习目标:将现实世界中的问题归类为分类问题、预测问题、序列决策问题、组合搜索问题、启发式搜索问题、对抗搜索问题、逻辑演绎问题或统计推断问题。
- 基本理解:推理问题可以根据所提供的输入类型、要产生的输出类型以及(如果适用的话)搜索空间的特征进行分类。
- 详细说明:当状态空间太大以至于无法检查所有可能的状态时,就需要启发式搜索。启发式搜索使用经验法则(启发式方法),通过关注最有希望的状态来限制搜索范围。在用于博弈的对抗搜索中,算法会在为玩家找到最佳走法和为对手找到最佳应对策略(从玩家的角度来看,这可能是最糟糕的走法)之间交替进行。如果游戏很复杂,比如国际象棋或围棋,对抗搜索可能需要使用启发式方法。在逻辑演绎中,推理者从一组事实出发,通过应用推理规则推导出新的事实。逻辑演绎可以使用形式逻辑(如命题逻辑或谓词逻辑)来完成,也可以使用与语义网络一起使用的临时推理规则,或者专家系统中常见的 “如果 - 那么”(IF-THEN)规则。统计推断涉及基于概率进行推理。
推理:推理算法(2-C-2)
- 学习目标:对于每一种推理问题类型(分类问题、预测问题、序列决策问题、组合搜索问题、启发式搜索问题、对抗搜索问题、逻辑演绎问题以及统计推断问题),列出一个可用于解决该问题的算法。
- 基本理解:人工智能包含各种各样的推理算法,用于解决不同类型的推理问题。有些算法使用符号表示(例如,搜索树),而另一些算法本质上是数值型的(例如,对特征向量进行操作的神经网络)。
- 详细说明:推理问题在 2-C-i 中进行了讨论。算法的选择取决于输入数据的特征以及要做出的决策的复杂程度。启发式搜索算法包括最佳优先搜索和 A * 搜索。对抗搜索可以使用组合搜索的变体来完成,或者通过使用 α-β 剪枝的启发式方法来实现。逻辑演绎可以使用归结定理证明的方法来完成,或者通过应用临时的 “如果 - 那么”(IF-THEN)规则来实现。统计推断涉及基于概率或分布进行推理,比如贝叶斯网络。
3. 机器学习(中学指南)
核心观点
- 机器学习使计算机能够在无需人们对特定行为进行显式编程的情况下掌握这些行为。(“机器学习” 的定义)
- 学习新行为源于学习算法对推理模型(如决策树或神经网络)的内部表示所做出的改变。(机器学习算法的工作原理)
- 当推理模型能够产生多种行为时,需要大量的训练数据来缩小学习算法的选择范围。(训练数据的作用)
- 由机器学习算法构建的推理模型可应用于新数据,以解决问题或做出决策。(学习阶段与应用阶段)
学习的本质:人类学习与机器学习对比(3-A-1)
- 学习目标:定义有监督学习算法、无监督学习算法和强化学习算法,并给出与每种算法类似的人类学习的例子。
- 基本理解:有监督学习算法和无监督学习算法都能在数据中找到模式。有监督学习利用特征来预测由 “教师” 提供的类别标签;无监督学习则将相似的实例归为一组,创建其自身的类别。强化学习通过试错法来找到一种策略,用于选择能够使强化信号最大化的动作。
- 详细说明:有监督学习就像是接受教练的纠正。无监督学习就像是根据顾客独特的购买模式,发现自己的店铺有三类不同的顾客。强化学习就像是在电子游戏中尝试不同的操作,然后看看哪种操作能获得最多的分数(最大的奖励)。
学习的本质:在数据中发现模式(3-A-2)
- 学习目标:模拟机器学习如何通过调整推理器的参数(其内部表示)来构建用于分类或预测的推理器。
- 基本理解:有监督学习会调整一个数学模型(由人类预先选定)的参数,以生成正确的分类或预测结果。这个模型可以是一个简单的线性方程、一个高次多项式,或者是一个更为复杂的非线性方程,比如深度神经网络。对输入和输出之间的关系进行编码的内部表示,体现了在数据中找到的 “模式”。
- 详细说明:在回归分析中,我们选择一个数学模型,例如线性方程\(y = mx + b\)" style="">,然后调整其参数,尽可能好地拟合一组数据点。然后,该模型可用于预测任何值对应的值。
线性回归可以通过使用直尺,凭肉眼观察直线与数据点之间的距离来完成。可以通过给学生提供一个带有滑块来控制参数值的图形显示界面,让他们模拟多项式回归或逻辑回归。他们可以手动调整滑块,以达到他们认为对数据的最佳拟合效果。对于水平更高的学生,可以向他们展示如何使用均方误差从数学角度衡量拟合的质量。对于分类问题,值为表示 “属于该类别”,表示 “不属于该类别”,而决策边界就是\(y = 0.5\)" style="">
学习的本质:训练模型(3-A-3)
- 学习目标:使用有监督学习算法或无监督学习算法,在现实世界的数据上训练一个模型,然后评估结果。
- 基本理解:在有监督学习中,模型在训练集上进行训练,以便为有标签的数据生成正确的标签。我们通过测量测试集中被正确标记的项目所占的百分比来评估结果。在无监督学习中,模型被训练来将每个输入分配到一组相似的输入簇中。由于训练数据没有附带标签,这些簇是由学习算法确定的。我们通过检查这些簇,看它们是否捕捉到了数据集中有用的差异来评估结果。
- 详细说明:有监督学习算法和无监督学习算法都能在数据中找到模式。在有监督学习中,“模式” 是特征值与类别标签之间的关系。在无监督学习中,模式是数据被分组为簇的方式。如今,现实世界的数据集在网络上广泛可得。在较低年级段,学生可能会在几个新的数据点上测试他们训练好的模型,但在这个年级段,要求学生对训练好的模型在一个有一定规模的测试集上的性能进行量化评估。
学习的本质:构建推理器与使用推理器(3-A-4)
- 学习目标:举例说明在使用机器学习构建分类器或预测器时,每个必要步骤中会发生什么情况。
- 基本理解:这些步骤包括:确定你想要解决的问题,弄清楚从何处获取训练数据,选择一个特征集,明确如何对数据进行标记,运行学习算法,使用交叉验证集来判断何时应停止训练,以及使用测试集来衡量性能。
- 详细说明:交叉验证集用于避免过拟合。测试集由在训练或交叉验证过程中未使用过的样本组成,因此它能对推理器在新输入上的性能给出无偏的预测。
学习的本质:调整内部表征(3-A-5)
- 学习目标:描述各种类型的机器学习算法是如何通过调整其内部表示来进行学习的。
- 基本理解:决策树学习算法通过一次添加一个节点的方式来构建决策树。神经网络学习算法会调整权重。回归算法会调整方程的参数。强化学习算法会更新价值预测或策略
学习的本质:从经验中学习(3-A-6)
- 学习目标:选择合适类型的机器学习算法(有监督学习、无监督学习或强化学习)来解决推理问题。
- 基本理解:主要的学习算法类型及其用于解决的推理问题类型如下:有监督学习用于分类和预测;无监督学习用于聚类;强化学习用于序列决策。
- 详细说明:有监督学习算法和无监督学习算法都会在数据中寻找模式。有监督学习算法使用有标签的训练数据,并调整推理模型的参数,试图生成正确的标签,它们用于解决分类或预测问题。
无监督学习算法使用无标签的数据,试图将相似的数据点归为一组,用于发现数据中的类别。强化学习算法用于解决序列决策问题,它们学习选择行动的策略,以使模型获得的强化信号最大化。
强化学习可能会比较慢,因为学习必须通过试错来进行,没有 “教师” 在每一步告知算法最佳行动。但让计算机从自身经验中学习也有其优势,即它能够发现事先并不知道最佳行动的问题的解决方案。
神经网络:神经网络的结构(3-B-1)
- 学习目标:描述以下神经网络架构及其用途:前馈神经网络、二维卷积神经网络、循环神经网络、生成对抗网络。
- 基本理解:前馈神经网络能够学习任意函数,可用于分类和回归任务。二维卷积神经网络学习与输入进行卷积运算的小 “卷积核”,以及用于降低图像分辨率的最大池化层;它们被应用于图像分析领域。循环神经网络具有反馈连接,用于自然语言处理。生成对抗网络包含生成器和判别器模块,被用于创建深度伪造内容。
神经网络:权重调整(3-B-2)
- 学习目标:使用反向传播学习算法来训练一个多层神经网络,并描述由于学习的进行,神经元的权重以及隐藏层单元的输出是如何变化的。
- 基本理解:神经元的权重最初是较小的随机值,然后通过学习逐渐演变成更精确的模式。神经元权重的变化是由一个由反向传播的误差信号驱动的学习规则来计算的。神经元的权重模式决定了该神经元所检测到的特征。
- 详细说明:不要求学生了解反向传播学习算法的具体细节,只需要知道误差是从较后的层向后传播到较早的层的。
- 活动:可以使用像 TensorFlow 游乐场这样的在线演示工具,来可视化学习过程中权重的变化情况。
数据集:特征集(3-C-1)
- 学习目标:从两个现实世界数据集所包含的特征以及这些特征的编码方式这两个方面,对它们进行比较。
- 基本理解:由人类来决定在数据集中纳入哪些特征以及如何对这些特征进行编码。这可能会对在这些数据集上训练的机器学习算法产生影响。
- 详细说明:年龄可以用月来编码(适用于儿科数据集)、用年来编码(适用于成年人数据集),或者用年龄区间来编码(如婴儿、儿童、青少年、成年人、老年人、高龄老人)。使用离散值对连续变量进行编码,可以引导学习算法做出符合人类对该领域理解的区分。
数据集:大型数据集(3-C-2)
- 学习目标:通过考量数据集的规模、数据的采集和标注方式、所需的存储空间以及预估的数据集制作时间,来评估用于训练实际人工智能系统的数据集。
- 基本理解:通常需要一个大规模的数据集,才能涵盖复杂领域的多样性,并缩小推理器可能行为的范围。构建、清理和验证数据集有多种方法。创建数据集和处理数据可能会产生高昂的成本。标注训练数据是一项劳动密集型工作,可能需要专业知识(例如,在 X 光片中识别疾病)。在数据集创建的每一个步骤中都可能引入偏差。
- 详细说明:现实世界问题的数据集可能包含众多特征,而且某一类别所具有的特征可能涉及这些特征之间的复杂关系。为了明确要学习的类别,并将其与其他数百万个可能的类别区分开来,学习算法必须接触大量的示例。
数据集:偏差(3-C-3)
- 学习目标:使用数据可视化工具,研究训练数据在性别、年龄、种族或其他人口统计学变量方面的不平衡情况,这些不平衡可能会导致模型产生偏差。
- 基本理解:机器学习算法会利用训练集中任何有助于降低错误率的不平衡或相关性。如果数据集不具有代表性,那么这些相关性可能会产生误导。
- 详细说明:可以使用 Excel 中的直方图,或者诸如 Pandas(用于 Python)等多种数据可视化工具,来进行数据探索,帮助学生发现数据中的不平衡或相关性。
4. 人机交互(中学指南)
核心观点
- 计算机能够使用自然语言来传达事实性信息,但在理解诸如隐喻、意象、幽默和讽刺等非字面意义的表达方式时却存在困难(语言是构成人类特性的一个重要部分。隐喻、意象和幽默是人类文化的一部分,然而,我们缺乏关于人们如何理解这些内容的精确且详细的理论,也不清楚计算机应该如何处理它们)
- 计算机能够识别情感,但无法体验情感。对于情感的恰当回应必须由人类进行编程设定(人工智能系统运用算法来识别人类的情感。然而,当机器对我们的痛苦表示同情时,它并没有一颗会为我们而感到疼痛的心)
- 当前的人工智能系统是专为处理定义明确的问题而设计的专用推理器。类似人类的灵活推理能力,即所谓的 “通用人工智能” 或 “强人工智能”,目前尚未实现(我们尚不清楚何时能够构建出能够模仿甚至超越人类推理能力的通用人工智能系统)
- 当前的人工智能系统缺乏意识和自我意识。一台具有自我意识的计算机需要对自身的存在和思想进行表征,并且需要存储其过往经历的记忆(意识是对自身存在的认知,也就是对自身身体和所处环境的察觉。自我意识则是认识到自己是一个有意识、能思考并且具备对自身思想进行推理能力的存在。有关这些观点的简要讨论可参见 Jabr (2012)的相关内容)
自然语言:语言结构(4-A-1)
- 学习目标:找出一段文本中计算机难以理解的部分,并解释其原因。
- 基本理解:计算机在理解运用了隐喻、意象、夸张、讽刺、幽默或文字游戏的文本时会遇到困难。
- 详细说明:目前,对于隐喻、意象、夸张、讽刺、幽默或文字游戏,我们还没有令人满意的形式化解释。这正是当前人工智能、语言学和认知科学研究的重点。
自然语言:语言歧义性(4-A-2)
- 学习目标:通过描述一个给定单词的多种含义,举例说明理解一个句子对计算机来说可能具有挑战性的原因。
- 基本理解:一个单词可能有多种含义。人们利用上下文和世界知识来确定其正确含义,但计算机通常无法以如此微妙的程度来表示含义。
- 详细说明:一个单词具有多种含义的现象被称为 “一词多义(polysemy)”。例如,“book” 可以指一种商业产品(“这本书是本畅销书”),也可以指一组文字内容(“这本书的语言适合中学生阅读”),或者是文本的实体形式(“这本书在我的背包里很重”)。同样,“class” 可以指一门学术课程(“一节数学课”),一个特定的课程实例(“河谷高中周二上午的数学课”),或者指参加课程的人(“老师向全班同学讲话”)。将此与幼儿园到二年级(K-2)中讨论的因同音同形异义词和同音异义词导致的词汇歧义进行比较。使用神经网络和大规模训练集的现代人工智能系统采用统计方法来解决词义歧义问题,但仅靠统计方法并不像人类的常识那样强大。
- 活动:使用谷歌翻译来探究计算机在为翻译选择合适的单词时,是如何解决一个单词的多种含义问题的。
自然语言:文本推理(4-A-3)
- 学习目标:展示如何使用一个简单的上下文无关文法来解析或生成简单句子。
- 基本理解:上下文无关文法描述了单词是如何组合成短语和子句的,并且能够表示自然语言的大部分句法结构,但它不能很好地处理主谓一致这类问题。
- 详细说明:主谓一致限制的一个例子是,主语和谓语在数上必须一致,例如,“he says(他说,第三人称单数)”,但 “they say(他们说,复数)” 。要在上下文无关文法中表达这一点,就需要为单数主语和复数主语分别制定规则。当句子变得更加复杂时,这会变得很繁琐,例如,并列连词可能不仅要求在数上一致,还要求在时态上一致。
关于句法歧义的例子,请参见 4-A-2.6-8年级,句法歧义会导致产生多个句法分析树,必须使用语义知识来消除这些歧义。
即使是一个简单的文法,如果它是递归的,也能够生成无穷数量的句子;请参见 4-A-1.3-5年级。 - 资源:可以使用斯坦福大学的上下文无关文法工具来构建分析树、生成句子,并验证一个句子的语法正确性。有关创建上下文无关文法的信息,请参考此资料。
自然语言:应用(4-A-4)
- 学习目标:描述几种自然语言处理(NLP)的方法,从简单的方法到较为复杂精妙的方法。
- 基本理解:简单的自然语言处理方法包括关键词匹配、字典查询和模板匹配,而更新的、更复杂精妙但透明度较低的方法则使用深度神经网络和机器学习。
- 详细说明:以聊天机器人为例,最简单的方法是在用户输入的内容中查找关键词,以此来决定给出怎样的回复。稍微复杂一点的方法是使用模板来描述一个短语可能出现的所有变体形式,而不是只关注单个短语。更先进的聊天机器人使用深度神经网络进行 “意图识别”,即检测输入内容的含义何时与某个模板匹配,而不是去寻找特定的单词或短语。
- 活动:学生应该能够描述这些方法在哪些情况下可能有用,哪些情况下可能没用,并解释这些方法的局限性。
常识推理(4-B-1)
- 学习目标:解释计算机要正确解读一则寓言或童话故事所需的文化知识和朴素物理学知识。
- 基本理解:对于人类或计算机来说,要推断一个故事的含义,需要理解文化知识、朴素物理学知识以及民间心理学知识。这对于计算机而言仍然是一项难题。
- 详细说明:寓言和童话故事对计算机来说具有挑战性,因为它们可能包含文化知识、复杂的人类动机、意象、幽默和隐喻。民间心理学指的是我们日常所具备的将心理状态归因于他人的能力,这些心理状态包括他人的信念、愿望和意图。
- 活动:解释要正确解析维诺格拉德(Winograd)语句中代词的所指对象需要哪些知识。一个维诺格拉德语句的例子是:“安娜在考试中比露西考得好多了 [差多了],因为她学习非常努力。” 在这里,所需的知识是为考试付出更多的学习努力会带来更好的考试表现。
情感理解(4-C-1)
- 学习目标:找出人工智能应用能够调整自身行为以回应人类情绪状态的方式。
- 基本理解:计算机可以通过认可人类的感受,并以一种让人类觉得有支持作用且符合社交规范的方式做出回应,从而恰当地对人类情绪做出反应。
- 详细说明:例如,基于人工智能的辅导系统会监测学生的行为,以识别出学生的沮丧、无聊和疲倦情绪,这样它们就能调整教学方式,或者提醒学生休息一下。能够检测人类情绪的自动化客服代理可以相应地调整自己的回复,比如,通过调整说话的语速和语调。
- 活动:鉴于计算机能够利用人工智能来识别人类情绪,讨论一下它们应该如何以一种我们认为有支持作用且符合社交规范的方式来回应人们。
- 学习目标:就人类智能与人工智能的不同观点展开辩论。
- 基本理解:一些人工智能专家和哲学家认为,计算机永远无法达到与人类完全相似的智能水平,而另一些人则相信人工智能最终将超越人类智能。
- 详细说明:声称计算机拥有类似人类的智能存在一个问题,那就是我们对于人类智能是如何实现的并没有清晰的概念。一个更有力的反对计算机智能的观点是,由于计算机没有实体的身体,它们无法像人类那样体验世界。另一方面,人类的记忆和推理能力是有限的,而计算机有可能超越这些能力,从而产生一种比人类更强大的智能(人工超级智能)。但我们也可能拥有一些执行复杂信息处理任务的设备,它们并不具备类似人类的智能。
- 活动:(1)解释图灵测试,选取图灵论文中的一段内容,将图灵所设想的对话与现代人工智能系统所能做到的进行比较。(2)比较动物智能与人类智能。(3)比较动物智能与人工智能。
5. 社会影响(中学指南)
核心观点
- 开发人工智能应用涉及技术和伦理双重设计决策。
- 人工智能应用涉及多方利益相关者,他们可能持有不同的价值观,并可能因设计者的选择受到不同影响。
- 涉及人类决策的人工智能系统应被设计为遵循公平性、透明度和隐私保护等社会价值观。
- 人工智能是一项颠覆性技术,不仅影响经济和就业,还将重塑社会与文化规范。
- 人工智能正成为每个人生活和职业工具箱中的组成部分。
符合伦理的人工智能:利益多样性与差异影响(5-A-1)
- 学习目标:解释人工智能系统的使用是如何对不同群体产生不同影响的。
- 基本理解:不同的人群群体可能会受到人工智能系统的不同影响。
- 详细说明:当一个系统的设计者没有充分考虑到用户之间的差异时,就可能会出现不同的影响。例如,使用过去的医疗支出情况来评估一位病人的患病严重程度,这一做法假定了每个人都享有相同水平的医保覆盖。若使用这种评估方式,将更积极的医疗护理安排给病情最严重的病人,那么对于那些医保覆盖水平较低的人群来说,就会产生不同的影响。机器学习系统中未被察觉的偏差(例如,简历筛选应用程序中的偏差)也可能会对某些群体产生不同的影响。
- 参考资料:https://www.scientificamerican.com/article/racial-bias-found-in-a-major-health-care-risk-algorithm/
符合伦理的人工智能:伦理设计标准(5-A-2)
- 学习目标:分析一个人工智能系统,以确定它是否符合伦理设计标准。
- 基本理解:为确保人工智能系统是有益而非有害的,伦理设计标准包括:公平性、透明度、可解释性、可问责性、对隐私的尊重以及对社会价值观的遵循。
- 详细说明:公平性意味着平等地对待每一个人。透明度指的是公开一个系统使用了哪些信息以及它是如何使用这些信息的。可解释性意味着能够为系统所做出的决策提供合理依据。可问责性意味着明确谁要为人工智能系统的行为负责。对隐私的尊重意味着不采取任何可能损害人们隐私的行为。遵循社会价值观意味着不做出任何违背这些价值观的行为。
- 资源:人工智能伦理相关资源目录:https://aiartists.org/aiethics
模型卡片(促进透明度和可问责性):https://modelcards.withgoogle.com/about
符合伦理的人工智能:践行伦理设计(5-A-3)
- 学习目标:运用符合伦理的设计流程来设计一个人工智能系统。
- 基本理解:在设计流程的所有阶段,符合伦理的设计都要考虑到所有利益相关者的价值观,并坚持公平性、透明度、可解释性、可问责性、尊重隐私以及遵守社会价值观等原则。
人工智能与文化:AI日常生活应用(5-B-1)
- 学习目标:解释随着人工智能技术持续发展并进一步融入我们的文化,可能会引发哪些类型的争论。
- 基本理解:一些新的人工智能技术将对社会的文化规范和期望构成挑战,而社会必须识别并应对这些挑战。
- 详细说明:一些潜在的争论包括:在与智能助手或机器人互动时,什么样的行为是可接受的?我们应该如何看待由人工智能程序创作或在人工智能程序协助下创作的文本或艺术品?在什么情况下学生使用大型语言模型来辅助完成家庭作业是可以接受的?机器学习工程师在使用人们的个人数据,或者以版权所有者未授权的方式使用公开可用的数据时,应该拥有哪些权利?预计还会出现更多诸如此类的争议。
人工智能与文化:信任与责任(5-B-2)
- 学习目标:确定对人工智能技术的使用进行监管是恰当的领域,并评估已提出的相关监管措施。
- 基本理解:在存在需要保护的社会价值观的领域,对人工智能技术进行法律监管是合适的。
- 详细说明:潜在的监管领域包括:用于警务或监控的面部识别技术的使用、对人工智能应用程序所积累的客户数据的隐私保护,以及自动驾驶汽车的安全性。
- 资源:人工智能与数字政策中心:https://www.caidp.org/resources/ai-policy-frameworks/
自动驾驶汽车法规:https://www.ncsl.org/research/transportation/autonomous-vehicles-selfdriving-vehicles-enacted-legislation.aspx
人工智能与经济:对社会部门影响(5-C-1)
- 学习目标:预测由于人工智能技术的影响,社会的某个领域在短期和中期内可能会发生怎样的变化。
- 基本理解:对于社会的健康发展而言,预见并规划新技术带来的变化是很重要的。
- 详细说明:与人工智能技术相关的两类影响分别是自动化水平的提高和新型服务的出现。未来研究所的前任所长罗伊・阿马拉提出了 “阿马拉定律”,其内容为:“我们往往会在短期内高估一项技术的影响,而在长期内低估它的影响。”
- 活动:(1)讨论由于人工智能可能会发展出的新型服务。(2)找出并解释人工智能系统在社会中引发的一个意外后果。
人工智能与经济:对就业的影响(5-C-2)
- 学习目标:探究从事与人工智能相关职业所需的技能。
- 基本理解:与人工智能相关的技能在整个劳动力市场中都将具有重要意义,而不仅仅是对程序员而言。大多数类型的工作都将涉及到与人工智能技术的某种交互。
- 详细说明:随着新技术的采用,工作的性质会在一个人的职业生涯中发生变化。人们可以预期在整个职业生涯中都需要不断学习。逐渐变得重要的与人工智能相关的技能包括:为机器学习收集和整理数据集;与帮助人们完成工作的智能代理进行交互;训练机器人完成特定任务;使用由人工智能驱动的创意工具进行图像创作和处理;以及为人工智能系统进行知识工程方面的工作。
人工智能助力社会发展:AI技术的平民化(5-D-1)
- 学习目标:使用你所选择的编程框架中可用的一些人工智能工具,创建一个新颖的应用程序。
- 基本理解:人工智能工具正变得日益常见且可免费获取,没有高等学位或昂贵设备的人也能够使用这些工具。
人工智能助力社会发展:利用AI解决社会问题(5-D-2)
- 学习目标:从一个 “人工智能促进社会公益” 项目所解决的问题以及该项目实际的或潜在的影响力方面,对其进行评估。
- 基本理解:“人工智能促进社会公益” 指的是运用人工智能技术来解决社会问题。
- 详细说明:“社会公益” 或公共利益旨在为最多的人带来最大的益处,让世界变得更美好。这包括诸如节能、环境保护、保护濒危物种、改善公共卫生以及预防人口贩卖等目标。
- 资源:谷歌关于社会公益项目的博客文章:https://blog.google/technology/ai/30-new-ai-for-social-good-projects/
《自然》杂志上关于 “人工智能促进社会公益” 的文章:https://www.nature.com/articles/s41467-020-15871-z